4大AIで音楽認識対決!まさかの結果に…【10分で分かる最新AI比較】

1. 音楽認識の比較検証結果

検証の結果、Gemini以外の3つのAIは、音楽ファイルを認識すること自体ができませんでした [04:04]。

  • Claude(無料版):音楽ファイル(音声ファイル)のアップロード自体が不可能でした [01:30]。
  • Grok:ファイルタイプがサポートされていないというエラーが出て、アップロードできませんでした [01:59]。
  • ChatGPT(有料版):ファイルはアップロードできたものの、「音源ファイルは確認できません」と回答し、音楽を認識できませんでした [02:38]。

2. Geminiによる音楽認識(唯一の成功例)

Geminiは、唯一、音声ファイルを認識し、曲の分析とタイトル提案を行いました [04:25]。

  • 曲の分析
    • 「ノリの良い洗練されたジャズファンクやフュージョンの楽曲」とジャンルを正確に把握しました [04:44]。
    • 「サックスやグルービーなベースラインが特徴的」と述べ、曲の雰囲気はある程度理解できていることが示されました [04:49]。
    • ただし、実際にはサックスは使われておらずピアノが主体であるため、細かな楽器のディテールまでは正確に認識できていないという課題も見られました [05:14]。
  • タイトル提案
    • 曲のジャンルや雰囲気から「スティーライト・グルーヴ」や「リズミック・フロー」など、複数の魅力的なタイトルを提案しました [05:30]。

3. 結論:Geminiのマルチモーダル機能の強み

今回の実験では、Geminiが唯一音楽を認識できたAIという結果になり、その背景には、テキストや画像だけでなく、音声など多様なデータを一括で処理できるマルチモーダル機能の強さが挙げられています [07:08]。