Vibe Coding の情報公開：Claude 4 により構文エラーが 25% 減／処理速度が 40% 向上

Vibe coding company says Claude 4 reduced syntax errors by 25%

2025/05/25 BleepingComputer — Vibe が発表したのは、同社のコーディング・ツール Lovable で Claude 4 を採用したことで、エラーが 25% 削減され、処理速度が40%向上したという情報だ。Claude Sonnet 4 と Claude Opus 4 という２つの新しいモデルは、5月22日に Anthropic が提供を開始したものである。Sonnet は無料ユーザーが利用できるが、Opus は有料サブスクリプションが必要であり、コーディングに関しては Sonnet の方が優れた性能を発揮する。

その一方で Anthropic は、Claude Opus 4 が SWE-bench (SWE：Software Engineering Benchmark) で、72.5% のスコアを獲得したことを、ブログ記事で明らかにしている。

そのテストにおいて、Claude Opus 4 は、集中的な作業と数千ステップを要する長時間実行タスクで、安定したパフォーマンスを発揮したという。さらに Anthropic は、この最新モデルにより、７時間連続のコード実行が達成されたと主張している。

Vibe は、「Lovable の AI 搭載プロンプト・ベースの Web アプリ・ビルダーで Claude を採用しており、Claude 4へのアップグレード後に、同様の改善を確認している」と述べている。Lovable は X への投稿で、「すべてのプロジェクトの作成と編集に Claude 4を導入した結果として、エラーが 25% 減少し、全体的に40%高速化された」と述べている。

Claude 4 on Lovable — **Claude 4 reduced syntax errors by 25% on Lovable AI**

別の投稿で Lovable の創設者である Anton Osika は、「Claude 4 は、Lovable における大半のエラーを解消した」と述べ、Vibe コーディングにおける LLM 構文エラーに言及している。

Claude 4 はコーディングの優れたモデル

Claude 4 に対しては賛否両論があるが、私は個人的に、Dart/Kotlin アプリを開発する際に、Claude 4 は Gemini と比べて、エラーの少ないコードを生成することに気づいたと、Anton Osika は述べている。

それはプロジェクトごとに、またコンテキストごとに異なるものだが、長いコンテキストを必要としないプロジェクトでのテストでは、Claude 4 の方が Gemini よりも優れた結果を示していた。

これまでも、Claude モデルはコーディングに最適という評判を得てきたが、最近の Google が、100万コンテキスト・ウィンドウを備える Gemini 2.5 Pro をリリースしたことで、激しい競争が繰り広げられている。

以前の Claude 4 モデルにおける 20万コンテキスト・ウィンドウと比較すると、Gemini 2.5 の 100万コンテキスト・ウィンドウは確かに優位性をもたらす。しかし、必ずしも Gemini 2.5 が Claude 4 よりも、コーディングにおいて優れているというわけではない。

どちらも、驚くほど優れていると同時に、ひどい結果をもたらすこともある。それは、プロンプト・エンジニアリングの実施方法にも左右される。

プランニングには o3 または Gemini を、コーディングには Claude 4と Gemini といった、複数モデルの組み合わせも良いと思われる。

Web アプリ・ビルダーに Claude を取り入れることで、エラーが 25%減少し、作業速度が 40%も向上したという、とても興味深い話です。最近では、用途に応じて複数の AI を使い分けるスタイルが、自然に広がってきているように思います。よろしければ、カテゴリ AI/ML も、ご参照ください。

M	T	W	T	F	S	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Claude 4 はコーディングの優れたモデル

Share this: