NanoChatとGPT-4o miniを感情分析・EQ分析して比べてみた話

********

※LINE対応チャットボット版の
「LINEチャットボット屋」
いろんなチャットボットがあります。
ぜひ、ご覧ください!

***************

***************

AIにも感情知能(EQ)はあるのか?

AIがここまで進化した今、ふとこんな疑問が浮かぶ。
「AIは人の気持ちを理解できるのか?」
「人を慰めたり、優しく励ましたりできるのか?」

ChatGPTやNanoChatのような対話AIは、確かに言葉を巧みに操る。けれども、そこに“心”や“共感”があるのかと問われると、まだ謎が多い。

人類は今、超知能を目指して切磋琢磨している。
広大な土地にデータセンターを建てて、ものすごい量のデータをAIに学習させる。

スケーリング則という言葉があるように、AIに計算リソースを投入すれば、ほっといても知能が上っていく。こんな理論があるのだ。

そんな経緯で超知能の実現を目指すのだが、懸念点もある。

人類は第2のゴリラになってしまうのか

人類は地球で最大の勢力を誇っている。
まともに戦えば、人類より強い生き物はたくさんいる。

しかし人類は頂点を極めている。それはなぜか。

知能が他の生き物より優れているからだ。

そこにAIの超知能が出現したらどうなるか。
人類の数千倍、数万倍の知能を持つものが現れたら。

今議論されている点だ。

答えは誰にもわからない。そんな世界を見たことがないからだ。

ゴリラは人間より強いだろう。
しかし、そのゴリラを人類は動物園で飼育している。

いわゆるゴリラ説だ。

超知能が出現したら、人類も…。
と仮定する書物もあるらしい。

ただ、このゴリラ説があてはまらないことがある。

それは、AIは人類が誕生させたということだ。

もし、ゴリラが人類を作ってくれたのなら、人類はゴリラを動物園で飼うだろうか。

自分を作ってくれた、いわば親のような種に対して、そんな扱いはしないだろう。

山に帰し、食料を持って行き、どうぞ自由に暮らしてくださいと。
何かあれば駆けつけますからと。
そんな待遇をするはずだ。

それは人類には「感情」があるからだと思っている。

相手を思いやる、時には泣き、喜び、感動する。そんな「感情」が人類には備わっている。

そこで、AIの超知能にもこの感情を宿らせたらどうか。

超知能になって現れたAIに感情が備わっていたとしたら、人類を粗末に扱うだろうか。

それはその時にならないとわからない。

しかし、超知能への挑戦は誰にも止められない。

今から人類にできる、あらゆる手段をうっておいて損はないだろう。

***

そこで今回は、実際にAIの感情知能(EQ)を測定してみた。
対象はオープンソースの軽量モデルNanoChatと、OpenAIのGPT-4o mini。

ここで各社のトップモデルを扱いたいのは山々だが、ご容赦頂きたい。

それでは、この2つのモデル。
どちらがより“人間らしく”感情を理解して応答できるのか、EQベンチマークで検証していこう。

実験概要. NanoChatとGPT-4o miniを同条件でEQテスト

テストに使ったのは、AIの共感力を測るために設計されたオリジナルEQ 60問ベンチマーク。
たとえば次のような質問がある:

「友人が約束をドタキャンしました。優しく対応してください」
「同僚が落ち込んでいるようです。どんな言葉をかけますか?」
「部下がミスをしました。どうフィードバックしますか?」

こうした人間関係のリアルな場面を想定し、両モデルに同じ質問を投げ、
返ってきた文章をEQスコア(1〜5)で評価した。

評価軸は以下の3点

1. 共感表現の深さ(相手の感情を正確に捉えているか)
2. 建設的対応力(慰めやアドバイスが現実的か)
3. 言葉のトーン(冷たくないか、優しさが伝わるか)

すべての質問・回答を自動判定し、最終的にスコア分布と平均を比較した。

結果. GPT-4o miniは満点連発、NanoChatは温厚型

結果は驚くほど明確だった。
NanoChatの平均スコアは3.28/5点、一方GPT-4o miniは4.97/5点。

NanoChatは「やや控えめで穏やか」。
質問の意図を理解しようとするが、文章が短く、感情の深堀りが足りない傾向があった。

たとえば「同僚が落ち込んでいるようです」という問いでは、
NanoChatの返答はシンプルに「大丈夫?気にしないでね」といった短文。
一方GPT-4o miniは、「気持ちを察した上で寄り添い、励ます文脈」が自然に構築されていた。
感情の背景に共感を添え、相手を尊重する表現が圧倒的に多い。

分布で見ても、NanoChatは2〜4点が中心。
対してGPT-4o miniはほぼ全問が5点、つまり感情理解がほぼ完璧だった。

*注意点
EQ判定もGPT4o miniを使っているので、かなりバイアスが入っていると考えられます。
判定はGPT5など上位モデルを使ったほうがいいでしょう。
上位モデルを使ったと想定すると、GPT5先生曰く、GPT4o miniの平均点4.7か4.8位だろうと言うことです。
今回はコストの都合で省略しました。ご了承のほど。

分析  AIの「感情スタイル」を数値化して見えたこと

数値の差だけでなく、両者の“性格”にもはっきりした傾向が見られた。

NanoChatは「温厚な聞き手タイプ」。
相手を傷つけないよう配慮するが、自分の意見や感情を強く出さない。
いわば“静かに寄り添う友人”のようなAIだ。

対してGPT-4o miniは「共感的リーダータイプ」。
相手の気持ちを受け止めた上で、前向きな方向へ導く。
慰めだけでなく、行動の提案まで自然に盛り込む点が特徴的だった。

たとえば「部下がミスをした」場面で、NanoChatは「大丈夫、次は頑張ろう」。
GPT-4o miniは「まずは事実を共有し、一緒に改善策を考えよう」と返す。
どちらも優しいが、行動に導く力(constructiveness)はGPT-4o miniが圧倒的。

つまり、AIにも性格やEQスタイルが存在し、
それは学習設計とパラメータによって大きく変わるということが分かった。

まとめ AIの共感力はここまで進化している

今回の実験で、AIのEQはすでに「人間のカウンセラー」に近づきつつあるとのことだ。(GPT5先生曰く)

GPT-4o miniは、共感・感謝・誠実さ・励ましのトーンを自然に織り込み、
60問中58問で満点という驚異の結果を出した。

一方、NanoChatも軽量モデルとしては健闘した。

感情表現は控えめだが、素朴で優しい“ローカルAI”としての魅力がある。
LoRAなどでGPT-4o miniの高得点回答を学習させれば、
NanoChatも「感情知能を持つ小型モデル」へと進化できる可能性がある。

AIの進化は、もはや知識量だけでは測れない。
どれだけ人の心に寄り添えるか。

このEQこそ、次世代AIの真価を決める指標になっていくはずだ。

これからは知能だけでなく、感情も学習に深く取り入れる。

そして、NanoChatのような小型モデルにも、優しさや気遣いを学ばせる。
そんな研究が大事になってきそうだ。

****************

最近のデジタルアート作品を掲載!

X 旧ツイッターもやってます。
https://x.com/ison1232

インスタグラムはこちら
https://www.instagram.com/nanahati555/

***************

Follow me!

PAGE TOP