B+ 仕事を楽しむためのWebマガジン

トピックスTOPICS

「寒いし誰も来ないから**としゃべってました」

 
glay-s1top.jpg
horiphoto / PIXTA
4月某日、いつものように横丁にフィールドワークに出かけると、いつもの店の立ち飲みカウンターで、常連のHがスマホで誰かと話していました。彼は筆者の姿を認めると、頼んだ一杯目が出てくる間に電話を切り、いつもの横並びに直って言うことには、「寒いし誰も来ないから友だちとしゃべってました」と。
 
でも、世間は彼のように、退屈しのぎの電話に付き合ってくれる友だちがいつでも誰かしら見つかる人ばかりではありません。むしろ、そうでない人のほうが多いと思います。
 
咄嗟にそう考えた筆者が「AIが話し相手になってくれる電話アプリってあるんかね。チャットはそりゃあるけどさ、テキストじゃなく電話で普通のおしゃべりをするアプリ」と話を振ると、Hは「あるんじゃないすか。僕は使ったことないけど」といかにも一切関心がない人らしい答えで、今晩はやたら冷えますよね、朝まで雨だったから放射冷却で空気が冷えるのよ、へぇ~放射冷却、ふぅ~ん、と天気の話に流れたまま、やがて来た別の常連も入って違うおしゃべりが始まりました。
 
 

AIとヴァーチャルボイス

 
もはや「普及する」という表現が陳腐になる勢いで生成AIが浸透しつつありますが、AIが生成できるのは動画やテキストだけではありません。ヴァーチャルボイスの生成はむしろ、それらに先立って浸透してきた技術です。
 
ヴァーチャルボイスには、100%AI生成の声から、人の声を元に音声合成エンジンでつくったボイスロイド、ボーカロイドの声(例;初音ミク、歌愛ユキ)まで、さまざまあります。いずれもクリエイターの趣味を多分に反映した声の数々です。
 
それをまたそれぞれのユーザーが、パラメーターを変えたりピッチやテンポを好みに調整(調声)したりして楽しんでいるわけで、もし筆者が、権利関係を全部クリアして好きな実在の人物の声をAIボイスチャットアプリに実装させてもらえるなら、薬師丸ひろ子さんに常盤貴子さん、鶴田真由さん、笠原弘子さんに具島直子さんは外せません*1。知人の女性編集者に言わせれば、「ポール・ウェラーの声こそ至高。小杉十郎太さんも良き」だそうです。
 
 

声優文化と“声そのもの”を愛でる文化

 
一説によると、「声優」という職業の芸能的・社会的地位が日本ほど高い国はないのだそう。背景には、高度経済成長期の外国映画・ドラマの吹き替え需要にまでさかのぼる声優文化の成熟があります。例えば故・森繫久彌さんは、1952年日本公開の映画『第三の男』でオーソン・ウェルズの吹き替えで圧倒的存在感を示しました。また、1954年同公開の『ローマの休日』では、オードリー・ヘプバーンを演じた故・池田昌子さんがヘプバーン本人から「私の声と似ている」と称賛されています。
 
アニメ市場の巨大さも日本の声優文化を支える要素の一つです。むしろ、ヴァーチャルボイスが現れる前までは――コアなファン層の間では今も――最大の要素かもしれません。ゲームの世界ではキャラクターボイス(CV)のキャスティングが作品の売上を左右するほどの影響力を持ちます。また、VR技術(メタバース、VTuber、VRチャット)登場後は一般の人たちも、ボイスチェンジャーを駆使して自身の声をキャラクター化し*2、あるいは音声合成エンジンを駆使してボイスコンテンツを創作し、アマチュアの垣根を超えて一大文化圏を形成しています。
 
ことほど左様に、日本では、声――実在か創作か、ヴァーチャルかリアルかを問わない声そのもの――を愛で楽しむ文化が、豊かに根付いているのです*3
 
 

日本語話者の特性とAIボイスチャットアプリ

 
これには、70年代に発見された「自然音も左脳で聞いている」という日本人の特徴が関連していると思います。日本語は母音が機能する割合が欧米語に比べて多く、そのせいで日本人は、虫の音、雨音、風の音のような母音優勢の音響も左脳(意味脳=言語脳)で聞く傾向があります*4。私たちにとって、虫が鳴く音は虫の声、風がさやぐ音は風の声なのです。
 
そうすると、もしかして、人が話す声のみならず自然音にも意味や情動的価値を感じられる日本語話者の感性は、AIボイスチャットに対しても、他の言語の話者より豊かな感じ方ができるのではないか。「AIが電話の話し相手になってくれるアプリ」は日本でこそ花開くジャンルなのではないか――。
 
そう思ってアプリを探すと、あるわあるわ、百花繚乱。戦国時代の様相を呈しています。ざっと拾うだけでも、Cotomo、Airfriend、Castalk、MOFURE、SynClub、クラッシAI、BIMOBIMO、etc・・・まだまだあります。
 
考えてみれば、そもそもChatGPT、Gemini、Grokといった汎用生成AIも、音声モードで使えば一応会話アプリです。・・・が、そこは「餅は餅屋」。調べると、「ボイスチャット」「音声チャット」と謳っていても「タップするとその発言だけキャラ(アバター)の声がボイス再生される」だけのものが混在しており、純粋に声で会話するアプリだけを切り出して比較はできませんが、おしゃべりのような情動的な会話には、やはり、声そのものを意識したAIボイチャアプリのほうが強いと思います。
 
 

孤独を乗り越えて現実に向かうきっかけに

 
AIが話し相手として受け入れられる理由としては、次の点があるようです。
 
●気を遣わなくていい
人間相手なら引かれるかもしれない事柄も遠慮なく話せる。関係構築を失敗してもリアルに壊れる関係がないからやり直せる。トライ&エラーが現実の対人コミュニケーションの練習になる。
●いつでも即レスしてくれる
現実の友人に連絡しづらい時間帯でも話し相手になってくれる。話を聞いてもらえなくて苛立ったり不安になったりする心配がない。寂しさや退屈をすぐに紛らわせられる。
 
いっぽうで懸念もあります。例えば、AIの肯定的態度に触れすぎると、否定・批判への耐性が弱まり、かえって現実の対人コミュニケーション能力が落ちる。リアルとヴァーチャルが区別できなくなり社会生活に支障を来す(=依存症)。コミュニティの同質性から来るエコーチェンバー効果により、思考に偏りが生じる、など。
 
また、OpenAIとMITメディアラボが行った昨年の調査では、AIチャットボットを使えば使うほど、もともと孤独だった人は孤独が悪化し、無味乾燥な音声チャットボットで特にその傾向が顕著だったとされています*5
 
ただし、調査で対象とされたのはChatGPT、汎用生成AIです。日本語話者の声を愛でる文化および感受性と、それらにより極限まで話し声としての自然さを追求した“話し相手特化型AI”であれば、どうでしょうか。あくまで妄想の仮説ですが、案外大丈夫な結果が出るかもしれません。
 
SNS等を通じて他者の状況との優劣を常に意識させられる、しかも単独世帯が世帯構成割合の最多を占める社会で、「寂しい」「自分は無価値だ」「情けない」といった感情を一人でどう手当てするかは、大きなテーマです。自己否定のループから脱して現実に歩み出すきっかけとなる話し相手アプリが待望されます。
 
 
 
*1 常盤貴子さんの声は話し終わりに鈴が鳴っていると感じるのは筆者だけでしょうか。なお、薬師丸ひろ子さんは声の立ち上がりから終わりの瞬間まで話している間ずっと、鈴が鳴っています
*2 中にはボイチェンなしで男性は女声に、女性は男声になりきる強者もおり、VR空間では両生類のもじりで“両声類”と呼ばれています
*3 英語吹き替え版で『AKIRA』の金田正太郎や『妖怪ウォッチ』の天野景太役を担当したアメリカの声優ジョー・ヨング・ボッシュによれば、アメリカでは「キャラクターはキャラクター」という考え方のため、誰が声を演じているかは、大半の人は興味がないそうです(日刊スポーツ 2021年2月22日)
*4 厳密には「日本人」は「日本語および一部のポリネシア系言語が母語の人」。また、母音が機能する割合が多いのは日本語が等時拍音(モーラ拍リズム)の言語であることと関連しています
*5 孤独な人は、AIとしゃべるともっと孤独になる(GIZMODO 2025.04.01)
 
(ライター 横須賀次郎)
(2026.5.13)
 
 
 

関連記事