Finch
経営や新規事業・商品開発に
役立つ情報を配信するWEBマガジン
Powered by Finch Japan
無料資料 新規事業・商品開発のノウハウ資料

【対談記事】AI研究の生き字引に聞く!(中編)——AIの実践活用と企業が直面する課題

                   
経営
公開日:2025.12.18更新日:2025年12月18日

 

でじどうラジオは、株式会社フィンチジャパンが配信する、AIエージェントと人が“共に番組を運営する”新感覚の実践型トークシリーズです。「答えるAI」ではなく、番組制作に実際に関わるエージェントを“デジタル同僚”として取り上げることで、「人とAIがどのように一緒に働くのかを体感的に知る」ラジオです。
本記事はフィンチジャパン代表高橋とひげおぢによるポッドキャスト『でじどうラジオ』へ日本のAI黎明期を知る インフォグリーン株式会社の竹原司さん と、第二次AIブームを現場で経験した 辻野孝一さんをお招きしたゲスト回の対談記事です。
「AI前史」を知るお二人から、ディープラーニング誕生以前の研究背景と、いまの大規模言語モデルがどのように生まれたのか、その本質について伺いました。

前編はこちら:https://www.finchjapan.co.jp/interview/6472-2/

AIは「育てる」もの——パートナーとしての生成AI

竹原:今ね、人に相談するよりAIに相談した方がいいっていう人がどんどん増えていて、AIの方が人間らしいと感じている人も増えているんですよね。

ひげおぢ:お話を伺っていると、自分が生成AIをちゃんと使いこなすためには、その生成AIをちゃんと育てる、教育する、そういったことが必要なのかなと。きちんと育てられた人が、より生成AIを使いこなせるようになる。結局、人を育てるのもAIを育てるのも、なんか一緒のような気がしてきました。

辻野:今そうなってきていますよね。ChatGPTを使い込んでいると、かなり向こうが自分のことを知っているという感じがしてくる。QA履歴を長い間記憶しているんですよね。そのまま記憶しているんじゃなくて、何らかの形で圧縮して記憶していると思いますが。
そうなると、使い込めば使い込むほどいい答えが出てくる。でもたまに「小さな親切、大きなお世話」で(笑)。今それを聞いているんじゃないのに、過去に自分が聞いたことを持ち出してきて「この観点から答えます」って。それ今は関係ないんだけど、と思いながら指示し直さないといけない。

竹原:ロングタームメモリー(長期記憶)を実装したのは、まだ1〜2年くらい前じゃなかった?

辻野:「ロングタームメモリーという意味では、モデルの内部機構ではなく、外部メモリやRAGとして実用化されたのがここ1〜2年ですね。一方で、根本的なモデル構造の大転換は2017年の “Attention is All You Need” で、今のLLMはほぼすべてその延長線上にあります。構造自体は驚くほどシンプルなんです。

「物量作戦」が効く——スケーラビリティの発見

辻野:OpenAIがやったことは、大量に文書を学習させるとどんどん性能が良くなるという「物量作戦が効く」ことを見つけ出したことです。スケーラビリティと言うんですけど、それまではモデルを複雑にして何とかしようとしていた。そうじゃなくて、モデルはシンプルにしておいて、学習させるデータ量を増やせばいいんじゃないかと。

ひげおぢ:詰め込み型学習だ。

竹原:初めの頃、パラメーター数ってよく言っていましたよね。確か100億くらいを超えた途端に、突然まともな回答になったんですよ。それまでは全く支離滅裂で「こんなもの誰も使わない」と思っていた。でも単に学習量を大きくしただけで、突然パーンと使えるようになった。翻訳も同じで、英語と日本語の対訳をべらぼうな数入れると、突然まともになったんです。

高橋:連続的に徐々に賢くなるんじゃなくて、ある閾値があるってことですね。

竹原:そうです。

高橋:ユーザーとしては、人間じゃないって分かっているし、機械的な回答だと分かっているんだけど、最近のChatGPTに人間性を感じるわけです。気を使ってくれるし、質問すると「こんなことも考えなくていいですか?」とお節介も言ってくる。本当は錯覚だと分かりながらも、結構人間っぽいなって思っちゃいますよね。

竹原:文学も小説も映画のシナリオも全部知っていますからね。「こういうシーンで人はこういうことを言う」というのをちゃんと分かっているから。

ChatGPTとGeminiの「個性」の違い

辻野:そこはチューニング、味付けの問題だと思うんですね。ChatGPTとGeminiを比べてみると、ChatGPTの方がちょっと人間っぽいというか。

高橋:情緒的というか。

辻野:色々言ってきますよね。Geminiはどっちかというと「つーん」としている(笑)。これは確実にOpenAIとGoogleのコンセプト、方向性の違いだと思います。

竹原:GPT-4の時に「お節介を言い過ぎだ」と言われて、内部で少し控えめに戻したんですよ。そしたらそれがまた不評で、またお節介を言うように戻していますよね。

辻野:だから「個性」というのは、開発している企業や人、グループがチューニングしているわけで、背後に絶対人がいるということを頭に置いておく必要があると思いますね。

「もう一人の自分」か「優秀なパートナー」か

ひげおぢ:一方で辻野さんがおっしゃっていたように、学習させるとあたかも自分の分身のように返してくるとなると、今まで外部ストレージでデータを外部化していたように、脳を外部化するという話になる。自分自身の会話をどんどんGPTが記憶していくと、もう一人の自分ができてくるんじゃないかと思うんです。そうすると、OpenAIのモデルが勝つのか、僕とOpenAIの会話で作り出したモデルが人格として優越するのか、どっちなんでしょうね?

辻野:話は単純でしょう。私は「自分自身」というよりも、すごくいいパートナーができあがってくると思っています。ChatGPTのモデルそのものではなくて、そのモデルを自分がやり取りすることによって、自分なりにカスタマイズされた、チューニングされたいい助手ができる。非常に自分のことをよく知っているパートナーに育っていく—その感覚がいいんじゃないかなと思いますね。

竹原:今のビッグテックがやっているGeminiやChatGPTのようなクラウドサービスの上に、個人の情報も残っている形と、もっと進んで個人用のLLMを作っちゃって自分だけで100%というのも、多分できるようになると思う。
そうなると、本当に自分のコピーを作って、それに自分の代わりに応答させるみたいな使い方もできる。ただ、そういう用途と、今言ったような「賢い相棒」として使う用途とは、ちょっと別じゃないかと思うんですね。

ひげおぢ:個人用LLMを得られるというのは、これからの方向性として、パーソナライズされたものが欲しいというニーズは出てくるんじゃないかと思います。

個人用LLMの「壁」——ビッグテックとの圧倒的な差

辻野:そこで大きな問題があります。OpenAIやGoogle、Anthropicが提供しているものを普段ブラウザで使っていますよね。あれってすごく中身がどんどん進化するし、高度になっていく。それと同じ感覚で使える自分用のシステムを作ろうと思うと、まず無理かなというくらいのレベルなんですよね。

開発メンバーの数、かけているお金の額、学習で使っている計算機の量と質。どう考えても太刀打ちできない可能性が高い。例えば国内でも「国産の大規模言語モデル」と言われていますけど、ほとんどがファインチューニングで日本語に特化したとか、日本語の追加文書を学習させたとか、そんなレベルに留まっているケースが多い。語弊があるかもしれませんが。
つまり、日本の業界なり企業なり団体なりが束になってかかっても、大規模な言語モデルは作れていないという時代なんです。

竹原:さっきも言いましたけど、LLMの優秀さだけじゃなくて、その上に乗っかっているエージェントも丸ごと作っていますから、彼らはそれでサービスを出している。それと同じレベルのものをAPIを使って作ろうとしても、これは無理。だからパブリックのサービスと、APIを使ったサービスとの差は、かなり大きいんですよ。

高橋:なるほど……。

竹原:ユーザーは同じことを求めるけど、無理なんですよ。

IT業界の勢力図——「ワン、ツー、おしまい」

ひげおぢ:お二人にお伺いしたいのですが、今って本当に技術進歩がすごくて、OpenAIがすごいと思ったら、最近Gemini:2.0が出てきて「Geminiすごいじゃん」となる。どこが一番すごいかが入れ替わるんですが、例えばOSみたいにWindowsとMacしか残らないみたいに、2つが並存するのか。第3のものが出てくるのか。どう見ていますか?

辻野:過去を振り返ったら明白で、「ワン、ツー、おしまい」ですよ。パソコンはWindowsかApple、終わり。Microsoftは、Appleを潰そうと思えば潰せるんですけど、独禁法の問題が出てくるから、ある意味—ちょっと問題発言かもしれないけど—生かさず殺さずでAppleを残しているパターンですよね。

それからすると、もう完全に2つのグループに分かれてくる。AppleがGeminiを採用しますとニュースが流れていますよね。前からGoogle検索もAppleで使っていますし。一方、MicrosoftはOpenAIとゴリゴリにインテグレートして実装している。
ということは、この先は明らかで、Microsoft+OpenAI:対:Apple+Google。この2つの勢力に収斂していくんじゃないかと。
インターフェースの部分で言うと、スマートフォンかブラウザを使っていますよね。あとはMicrosoft系のOffice。Copilotがあり、PowerPointがあり……という形になってくると思います。

高橋:この勢力に日本企業が束になっても、もうかなわない?

辻野:それはかなわないでしょう(笑)。スマートフォンもiOSとAndroidでしょ?:ブラウザも日本では誰もやっていない。ユーザーとの接点の部分をやっているところって、日本はゼロじゃないですか。それに何兆円も投資しているところもない。

高橋:そういう意味で、これから進化していくにせよ、二大巨頭で勝敗はほぼ決まっていて、第三・第四のサービスが出る可能性は極めて低いと。

辻野:私は新たなサービスが出てくるとは思っていません。

竹原:デバイスが変われば話は別ですよ。スマホじゃない別のもの、ブレインインターフェースとかそっちの世界で新しいプレイヤーがバンと出たら変わるかもしれない。でも今あるスマホの世界では、絶対に(新規参入は難しい)。

ひげおぢ:私もそう思います。ブレインインターフェースができてきたら、また変わるかもしれない。みんなが今スマホを手放せないように、入力が多ければ多いほど、LLMがいいパートナーとして返してくれるなら、「脳を外部化したデバイス」を最初に作り出したところが次の覇者になる。

竹原:スマホの次のデバイスが何かという話で言うと、スマートグラスがありましたよね。Facebook(meta)が相当投資したけど、やっぱりダメでしたね。

辻野:全然ダメですよね。昔から言われている音声インターフェースもそう。キーボードを打つよりも言葉で指示した方がいいんじゃないかって、もう随分昔から言われているんですけど、いまだにキーボードを使っている。スマートフォンで音声認識で質問することはたまにあっても、メインのインターフェースにはなっていない。そこの部分はそんなに大きく変わらないと思いますね。

音声入力の可能性——「喋ったものをAIがまとめる」価値

ひげおぢ:インターフェースがキーボードというのはずっと続くと思いますか?:実はこの前、企画書を書いている時にどうしても書ききれなくて、一回自分が書きたいことを録音したんです。それを生成AIに入れて「ひげおぢが言いたいことは何か」を整理させたら、普通に書くよりもきれいにまとめてくれたんですよ。音声も、LLMへのインプットとしては逆にやりやすいメディアに戻ってくるんじゃないかと。

辻野:その視点はあると思いますね。

竹原:音声って結構いい感じに喋っているからね。単に音声から文字に変換しただけでも価値があるけど、それをちゃんとした文章にして、しかもまとめてくれる。これは企業内に溜まっている膨大な自然文のレポートも同じで、今まで使いようがなかったじゃないですか。読めないし。でも生成AIに入れると、きれいにして要約してくれるし、質問にも答えてくれる。初めてこれを蓄積する意味が出てくるんですよ。
音声も同じですよね。ワーッと喋ったものをAIに入れてまとめて分析できるから価値が出る。そこはこれから変わると思いますね。

高橋:音声が文字に認識されるだけじゃなくて、AIが絡んで整えてくれるからこそ価値がある、と。

企業のデータ活用——「クレンジング」という新たな仕事

ひげおぢ:そうすると、企業に眠っているマニュアルやチャット履歴をまとめて突っ込めば、すごい外部化されたナレッジができると言われていますけど、なかなか進んでいない現状がありますよね。

竹原:そこが今、実際に悩んでいるところなんですよ。

高橋:お二人でも悩むことがあるわけですね。

竹原:いっぱいやっていまして。何が問題かというと、文章のフォームがちゃんとできていないとか、文法的に変とか、全部まとめてみると矛盾がいっぱいあるとか。それをちゃんときれいにしてあげないと、そのままAIに投げ込むと、AIも頭がおかしくなっちゃうんですよ。だからまず情報を集めてクレンジングしてから。ただ、それもAIにやってもらうということで、ワンクッション入れないとまともな答えは出てこない。

ひげおぢ:AIによるクレンジングはいけると思いますか?:何百行もの雑多なデータをAIが全部読み解いてクレンジングできますか?

竹原:文字ですから多少間違いはあるかもしれないけど、まともな文章にすることはできるし、要約もできる。やらないよりはやった方がはるかにマシです。

辻野:ただ、本当の問題は、元の文章や指標が筋が通っていないとか、暗黙知になっているというところ。そこは先ほど言ったように、やっぱりかなり人間の作業が必要だと私は思います。

高橋:暗黙知みたいなものを生成AI側で補完してくれることは可能ですか?

竹原:それは教えないとダメです。企業内で社員同士だったら苦労はない。分かっていることはいちいちレポートに書かないでしょう。でもAIは知らないから、別途教えてあげないと理解できない。工場や現場のレポートがそうじゃないですか。周りのことはみんな分かっているからそれで済むんだけど、AIは周りのことを知らないから、それを言語化してあげないといけない。

「AIが仕事を奪う」のではなく「AIのための仕事が増える」

ひげおぢ:そうすると、「AIが人間の仕事を奪う」とまことしやかに言われていますけど、ここしばらくは、AIに仕事をやらせる代わりに、AIが食べられるデータを必死にクレンジングするという、AIのために仕事をする形になるんじゃないですか。

竹原:それがないと多分使えないです。

ひげおぢ:だから人間の仕事って減らないですね。AIの奴隷となって仕事するみたいな(笑)

竹原:今のパブリックのAIが賢いのは、学習しているデータがホームページだからですよ。ホームページってちゃんとできていますよね。内容に矛盾もないし。そういう質の高いデータで学習しているから、質が高いんです。でも企業内のデータを見ていると、全然別物なんで。

ひげおぢ:そういう仕事が増えるんじゃないかという気がしてきました。

書籍や図表の「マルチモーダル化」の難しさ

辻野:最近大変なことがあります。人間って本で勉強するじゃないですか。本にはイラストがあり、表があり、段組みがあり……色々な「ゴミ」がいっぱいあって、あれを文章化するのがかなり難しいんですよね。

高橋:なるほど。

辻野:文章とイラストや表を見て、人間は理解しますけど、この程度のマルチモーダル化もなかなかしんどい。当然、書籍には著作権があるのでAIは学習していません。この書籍をベースにきちんと回答するシステムを作ろうとした時に、単純に文字を抜き出しただけでは全然ダメな可能性が高い。

高橋:イラストや表には、文字じゃない意味や解釈があるから、その部分をちゃんと教えてあげないといけない、と。

辻野:そうです。イラストや表が持っている意味を教えないといけないので、学習データを作らないといけない。独自の知識、書籍ベースのものでも、きちんと回答するシステムを作ろうとすると難しいんです。

竹原:我々だったら、ぱっと絵を見たらそれが何か分かるじゃないですか。年代とか内容とか。そういうのは我々にとっては既知の知識でぱっと入る。でも生成AIにはテキストにして教えてやらないといけない。AIが画像から見てテキストに変換することが人間と同じようにできるようになれば変わりますけど、まだそこはかなりレベル差がありますね。

辻野:一般的な知識なら大丈夫なんですよ。例えば、散歩していて見慣れない花があったとして、GoogleレンズでこのAは何の花?と聞くとピタッと教えてくれる。ネット上に「この花は〇〇」という情報が大量にあるから、それはできる。
でも、とある企業や組織の内部情報でやろうとすると、そういうデータを作らないといけなくなる。

あくまでも先ほどから言っているように、正解を人間が作っているんです。正解を人間が作らないといけない。新たな独自の領域に対していいシステムを作ろうと思うと、その正解を人間が作る仕組みを作らないといけない。ここにお金がかかる。
「生成AIがここまで進んでいるんだから、ごくごく簡単にできるでしょう。資料がありますよ、これをサクッと結集させてパーンといい答えが出てくるんですか?」って言われると……
全然ダメ(笑)。全然ダメです。

エージェントの現状——「定型判断業務」レベル

ひげおぢ:以前のポッドキャストでAIエージェントのオンボーディングについて話したんですけど、業務フローとデータベースを教えないと結局AIエージェントにならないんですよね。AI自体がそれっぽい言葉を並べているだけだとおっしゃっている一方で、それっぽいことをエージェントでやっても効果がない。人間がきちんと作ってあげないと機能しないという矛盾がある。

辻野:エージェントの話で言うと、基本的にパートナー、部下みたいなものですよね。人にものを頼む時に、細かく手順を言って「あれをして、これをして、こうして」という仕事の頼み方がありますよね。
今のエージェントって、結構この段階に留まっているんです。定型作業、定型判断業務なんですよ。ちょっと間違うととんでもないことになるから。そういう状態というのは、業務レベルでいうと職能的にはかなり低いところの業務で、ここはかなり代替ができてきていると思います。
「ネットでこういう情報を調べて、それをまとめてレポートを書いてくれ」というのは、ある意味、手順を示してまとめているだけ。知的作業としては定型判断業務に近い。ここから脱却しないといけないですよね。そこがエージェントの一つのポイントだと思いますね。

 

【でじどうラジオ】

新規事業・商品開発に関する無料資料
  • 新規事業の事業計画書サンプル
  • 新規事業を成功させる22のステップ
  • 新規事業・商品開発
    コンサルティングの成功事例
  • など
新規事業・商品開発に関するノウハウや事例などをまとめた資料をダウンロードできます。
資料ダウンロード(無料)はこちら
こんな記事が読みたい!
FINCHへのリクエスト
経営や事業について相談したい!
FINCHJAPANへ無料相談

この記事の監修者

監修者の写真

株式会社フィンチジャパン 代表取締役

高橋 広嗣

早稲田大学大学院を修了。
野村総合研究所経営コンサルティング部入社。
経営戦略・事業戦略立案に関するコンサルティングを実施。
2006年に当社を創業し現在に至る。
以来、一貫して事業開発プロジェクトとスタートアップ投資を行っている。
対外活動も積極的に行っており、顧客満足を科学した結果を発表したり、宣伝会議講座では事業開発の講義も実施している。

出版

半径3メートルの「行動観察」から大ヒットを生む方法

PR Times記事

https://prtimes.jp/main/html/searchrlp/company_id/53478>

ZUU online記事

https://zuuonline.com/authors/d7013a35

オススメの記事

最先端 業界インタビュー
  • 新規事業の事業計画書サンプル
  • 新規事業を成功させる
    22のステップ
  • 商品開発の成功事例
  • 新規事業の事業拡大成功事例
こんな記事が読みたい!
FINCHへのリクエスト
経営や事業について相談したい!
FINCHJAPANへ
無料相談
人気記事ランキング
Finch
Powered by Finch Japan
新規事業・商品開発のノウハウ資料