Vibe coding company says Claude 4 reduced syntax errors by 25%
2025/05/25 BleepingComputer — Vibe が発表したのは、同社のコーディング・ツール Lovable で Claude 4 を採用したことで、エラーが 25% 削減され、処理速度が40%向上したという情報だ。Claude Sonnet 4 と Claude Opus 4 という2つの新しいモデルは、5月22日に Anthropic が提供を開始したものである。Sonnet は無料ユーザーが利用できるが、Opus は有料サブスクリプションが必要であり、コーディングに関しては Sonnet の方が優れた性能を発揮する。

その一方で Anthropic は、Claude Opus 4 が SWE-bench (SWE:Software Engineering Benchmark) で、72.5% のスコアを獲得したことを、ブログ記事で明らかにしている。
そのテストにおいて、Claude Opus 4 は、集中的な作業と数千ステップを要する長時間実行タスクで、安定したパフォーマンスを発揮したという。さらに Anthropic は、この最新モデルにより、7時間連続のコード実行が達成されたと主張している。

Vibe は、「Lovable の AI 搭載プロンプト・ベースの Web アプリ・ビルダーで Claude を採用しており、Claude 4へのアップグレード後に、同様の改善を確認している」と述べている。Lovable は X への投稿で、「すべてのプロジェクトの作成と編集に Claude 4を導入した結果として、エラーが 25% 減少し、全体的に40%高速化された」と述べている。

別の投稿で Lovable の創設者である Anton Osika は、「Claude 4 は、Lovable における大半のエラーを解消した」と述べ、Vibe コーディングにおける LLM 構文エラーに言及している。
Claude 4 はコーディングの優れたモデル
Claude 4 に対しては賛否両論があるが、私は個人的に、Dart/Kotlin アプリを開発する際に、Claude 4 は Gemini と比べて、エラーの少ないコードを生成することに気づいたと、Anton Osika は述べている。
それはプロジェクトごとに、またコンテキストごとに異なるものだが、長いコンテキストを必要としないプロジェクトでのテストでは、Claude 4 の方が Gemini よりも優れた結果を示していた。
これまでも、Claude モデルはコーディングに最適という評判を得てきたが、最近の Google が、100万コンテキスト・ウィンドウを備える Gemini 2.5 Pro をリリースしたことで、激しい競争が繰り広げられている。
以前の Claude 4 モデルにおける 20万コンテキスト・ウィンドウと比較すると、Gemini 2.5 の 100万コンテキスト・ウィンドウは確かに優位性をもたらす。しかし、必ずしも Gemini 2.5 が Claude 4 よりも、コーディングにおいて優れているというわけではない。
どちらも、驚くほど優れていると同時に、ひどい結果をもたらすこともある。それは、プロンプト・エンジニアリングの実施方法にも左右される。
プランニングには o3 または Gemini を、コーディングには Claude 4と Gemini といった、複数モデルの組み合わせも良いと思われる。
Web アプリ・ビルダーに Claude を取り入れることで、エラーが 25%減少し、作業速度が 40%も向上したという、とても興味深い話です。最近では、用途に応じて複数の AI を使い分けるスタイルが、自然に広がってきているように思います。よろしければ、カテゴリ AI/ML も、ご参照ください。
You must be logged in to post a comment.