新たな産業革命。生成AIのトレンドはあらゆる産業に広がる。技術の進歩が急速なため、法整備やガイドライン策定が追いついていないが、今後の発展は止まらないだろう。
どこまで日常でキャッチアップして、日々の生活で使いこなしていくか。みなさんは、どれくらい使っていますか?
チャット型AIの比較
・チャットGPTの推論モデルのIQは120。すでに大半の人間より賢い。
・クロードは15万ワードまたは400ページ以上の文章を処理できるのが強み。大量の文章をまとめるのに真価を発揮する。
・ジェミニは録音からの議事録作成や画像の注釈作成などで活用される。
・ディープシークは開発費を抑えたのにチャットGPTに近い性能を持つ。
・チャットGPT、クロード、ジェミニの御三家は、チャット型なのに検索機能をはじめ、チャット内でプログラムのコードを書き、そのまま実行できる。
画像&動画生成型AIの比較
・ミッドジャーニーはアニメ風から写真調までさまざまなスタイルの画像をテキスト指示だけで生成でき細部の調整も簡単。
・動画生成型も大きな転換期。以前は数秒程度だったのが新世代のモデルは数分間の長さの高品質映像を生成できるようになった。簡単な設定で滑らかな映像が得られる。
・ソラはテキストの指示からフルHD映像を生成する能力。
・ランウェイジェン3もウェブ上で簡単に動画を生成編集できる。
・これらが普及すると広告映像や教育動画、SNS用コンテンツなどを短時間で量産できる環境が整う。
検索特化AIの比較
・従来のチャット型生成AIは「ググる」といった従来の検索エンジンのようには使えなかった。最新情報を検索しようにもAIを学習させた時点、例えば数か月前までのデータしか持っていないから。そこで台頭したのが検索特化型でリアルタイムに検索した情報を基に回答を生成できる。
・パープレキシティーは最新のニュースや学術データを参照した回答を生成する。情報源のURLも明示されているため回答の根拠も一目でわかりファクトチェックもできる。
・日本発のフェローは多言語対応が可能。質問を入力するだけで関連トピックをまとめたスライドも自動作成され、発表の時間を大幅に短縮できると好評だ。
・従来の検索エンジンのあり方が変わりつつある。キーワード検索から出た大量のリンク一覧から自分で情報を探すスタイルは手間がかかる。最初から要点をまとめて提示する方法が主流になっていく。そうなればユーザーの利便性は高まるが、多くのウェブサイトへのアクセスは減少するだろう。ネットでの現行の広告モデルで収益を得るメディアはビジネスモデルの変革を求められる。
プレゼン資料用スライド生成AIの比較
・ガンマはタイトルや概要の入力だけでページ構成やテキスト、時には画像まで含めたプレゼン資料が瞬時に完成する。利用者は後から細部を調整するだけで済み、レイアウトに悩む時間が大幅に削減される。
音楽&音声生成AIの比較
・「スノー(suno)AI」は入力したテキストから曲調やボーカルを含む楽曲を作り出す。
・「コエフォント(coefont)」や「ボイスボックス(voicevox)」は自然な音声合成でナレーションやアナウンス制作の分野を切り開いた。動画編集と組み合わせることで制作の効率化に貢献する。
ソフトウェア開発のAI
・ソフトウェア開発の現場でもAIがコードを自動作成し、バグの発見修正までを支援する時代になりつつある。「カーソル(cursor)」や「レプリット(replit)」のようにプログラミング編集に対話型AIを統合し、開発者のアイデアを素早く形にするものも次々と登場している。
本記事は以下の雑誌の特集記事を抜粋しました。
ロボットソングといえば、いの一番に思い出す歌。1983年のヒット曲。たしか1980年ごろのアメリカのティーンエイジャー人気バンド1位がヴァンヘイレンで2位がSTYXでした。STYXのLPのライナーノーツだったかに書かれていました。集客ができると単なる音楽ビデオにカネがかけられる。ネトフリの製作費が潤沢なように。