空耳を自動生成するプログラムの開発を進めたい!

支援総額
114,000円
達成率
56%
サポーター
31
残り時間
46

プロジェクト内容 コメント 24 進捗報告 0

academistスタッフからの一言

「空耳っておもしろい!」というワクワクから生まれた研究開発

「いま◯◯って聞こえなかった?」「空耳じゃない?」という会話をしたことがある人も多いのではないでしょうか。ただの聞き間違いともいえる空耳ですが、なぜかおもしろく感じるものでもあります。そしてそのおもしろさにハマってしまったという島谷さん。空耳に対する理解を深めるため、また自分が開発したプログラムで自分も人も笑わせるため、「空耳自動生成プログラム」の研究開発に乗り出しました。世界有数の空耳大国でもある日本で、世界に先駆けて空耳研究を進めます!

Motsuka

担当者:大塚美穂

日本で古くから受け入れられてきたユーモア「空耳」がおもしろい

大塚愛『さくらんぼ』を野球選手名で歌ってみた」という替え歌動画をyoutubeで目撃したことが、私が空耳に興味をもったきっかけでした。大変笑いました。関連動画を見て、また笑いました。このような空耳替え歌の動画を見続けているうちに、なんでただの単語の羅列がこんなにも笑えるのだろう、と別の意味でも「おもしろく」感じるようになりました。

空耳とは、ある言葉が別の言葉に聞こえる現象のことです。たとえば、英語の”I surrender”が日本語の「愛されんだあ」に聞こえる、野球選手の名前の並びがJ-POPの歌詞に聞こえる、といったものがあります。私は現在、後者の空耳、つまり「種類が限定された単語による空耳」の自動生成プログラムを開発しています(例:国名だけで「地上の星」歌ってみた(空耳自動生成))。使える単語の種類が限られている状況で、それをうまく並べて元の文章に音韻を近づける、ということをやります。

私が空耳自動生成プログラムを作りたい理由は2つあります。ひとつは空耳とは何かを理解するためです。空耳の知覚原理に関する研究は進んできているものの、どういった文章が空耳になりうるのか、そしてどんな空耳がおもしろいのかといったことはよくわかっていません。何かを理解する方法のひとつに、「作ってみる」というものがあります。コンピュータを自作することを通じてコンピュータに対する理解が深まるように、空耳を作ってみることで、空耳に対する理解が深まると考えました。

もうひとつの理由は、シンプルに空耳がおもしろい(笑える)からです。昔から人を楽しませることが好きでした。自分が開発したプログラムで自分も人も笑わせることができたら、こんなに嬉しいことはないと思いました。特に、日本は世界有数の空耳大国です。掛詞のような音韻の類似性を利用したユーモアに、1300年前の万葉集の時代から親しんできた日本人にとって、空耳もまた受け入れやすいユーモアのひとつだったのだと考えられます。であれば、日本人がである私が、世界に先駆けて空耳自動生成の研究をすることには意味があると思いました。


空耳の知覚原理と、自動生成の方法

空耳に関する先行研究は、その知覚原理に関するものと、自動生成に関するものに分けられます。まず知覚原理については「曖昧な音を聞いたときに既知の単語を使って脳が予測しているのではないか」と考えられており、fMRIを使って脳活動を調べる研究からそれを示唆する成果が最近(2018年6月)に発表されました。しかし、どういった文章が空耳になりやすいのか、空耳になぜおかしみを感じるのか、など解明されていない点はまだ残されています。

空耳の自動生成に関する研究は、海外よりも日本で多く行われています。その多くは英語を日本語に置き換える研究であり、英語音声を日本語音声認識ソフトウェアに入力する方法や、2言語間のIPA発音記号の近さを利用する方法が検討されています。日本語を日本語で置き換える研究はほとんどされていません。近いものに、音素の近さに基づく駄洒落生成や音程を考慮した替え歌生成の研究がありますが、20音節程度以上の「比較的長い日本語文を音素の近い限定された単語の並びに置き換える研究」は、私が調査した範囲ではありませんでした。


長い日本語文を少ない単語数で置き換えること

本研究で扱う「限定された単語による空耳自動生成」は、今まで注目されていなかっただけで作ること自体は簡単なのかというと、そうでもありません。先行研究との大きな設定の違いは、使える単語の種類が極端に少ないことです。先行研究の設定では一般的な日本語辞書に含まれる語彙(約60万語)のすべてが使えたのに対し、本研究では100~1000語程度の単語しか使えません。少ない単語数で精度の高い空耳文を生成する方法を考える必要があります。また、替え歌などへの応用ができるように、もとの日本語文が長くてもうまく変換できるようにする必要があります。このため「長い日本語の元文をどう区切って単語で置き換えればよいか」という問題がでてきます。

これらを解決するには何らかの最適化手法を適用するのが良いと考えられます。ただし、現実的な計算時間で終えるためにどのようなアルゴリズムを用いるか、最適化のパラメータに何を用いるかということは、探索的に調査していく必要があります。

B3

空耳の精度やおもしろさに影響する評価指標を見出したい

本研究では、複数の評価指標に基づくある評価値を設定し、その評価値が最大化するような空耳単語列の並びを出力する最適化アルゴリズムを開発します。パラメータとなる評価指標の候補は無数に考えられますが、まずは文字列の近さと文節一致度、を指標とします。文字列の近さは、編集距離(ある文字列を別の文字列に編集するために必要な操作回数)で定量化します。文節一致度は、より正確にいえば、元文の文節の切れ目と、空耳文の単語の切れ目が一致しているかどうかの評価指標です。これらの指標の線形和から求められる評価値を、動的計画法を用いて最適化します。

この手法に基づき開発したプロトタイププログラムの出力例を示します(下図)。大塚愛『さくらんぼ』の歌詞を入力として、日本のプロ野球選手の苗字または名前だけの空耳文を生成しました。「あの向 こうに」が「アオイ コウジ」となっているように、文字列の近さと文節一致度の両方を考慮することで、必要に応じて単語の途中でも区切りつつ、音韻の近い文章を生成できていることがわかります。

今後は、プログラムから出力された空耳文を、人に主観評価してもらうことで、空耳の精度を評価します。また評価指標の重み係数を変えながら複数種類の空耳文を生成し、精度を比較することで、どのような評価指標が重要であるかを検証します。得られた結果に基づき、より精度の高い空耳文を生成できるようにプログラムを改良します。これらの研究プロセスを通じて、限定された単語による空耳文自動生成プログラムを開発するとともに、空耳の精度の高さやおもしろさに影響を与える評価指標を明らかにします。

%e3%81%95%e3%81%8f%e3%82%89%e3%82%93%e3%81%bc

研究費サポートのお願い

クラウドファンディングに挑戦することを決めた理由は大きく2つあります。ひとつ目は研究費の獲得です。ここまで無料のライブラリを使いながら個人で費用をかけずに開発を続け、空耳自動生成の基本的な機能を実現することができました。今後は、本プログラムを外部サーバに設置してWebアプリ化し、沢山の人に使ってもらうことと並行して、改良を進めていこうと考えています。このためにサーバレンタル費用がかかります。また研究サイクルの効率化のため、システムの開発とアンケート評価を可能な範囲で外注していきたいと考えています。

2つ目は学術クラウドファンディング自体をやってみることに興味があったからです。まず、研究者としての自立性を高めるため学生のうちに自分自身で研究費を得る経験をしておきたいという思いがありました。加えて、クラウドファンディングのような、個人を、組織ではない多数の個人が支えるというコミュニケーション形態は今後の主流になっていくと考えており、専門課程でコミュニケーションに関する研究を行っているひとりの人間として、そうしたコミュニケーションに身を投じた際の心の動きを当事者として感じられる機会に強い興味がありました。

今後の目標は、本研究を通じて、人が使う言語の音韻特徴に関する理解を深めつつ、世界の笑顔の総量を0.1%増やすことです。空耳は日本人が特に古来から親しんできた文化である一方で、空耳をおもしろく感じるセンスは全世界で共通です。本研究における自動生成の手法は理論上あらゆる言語に適用可能であるため、本研究を発展させていくことで、クールジャパンのように日本発で世界に認められる文化のひとつを創造できる可能性もまったくのゼロではありません。

また、本チャレンジを通じて、研究者が自由研究的に、身近なワクワクに従った研究をやる土壌ができると良いなと思っています。学術クラウドファンディングは私が所属する大阪大学では前例がなかったため、多くの先生方にお願いしてなんとか実現までたどり着くことができました。私の事例をきっかけに、クラウドファンディングが広まって、私の身近な人が自由に研究を楽しめるようになれば、それは環境の活性化になり、私自身にとっても居心地のいい空間が形成されると期待できます。そんな居心地の良い研究空間を作り上げるための第一歩としてクラウドファンディングが広まればいいなと思っています。

挑戦者の自己紹介

Profile

島谷二郎(しまやじろう)と申します。名前から「しまじろう」というあだ名で呼ばれることが多いです。出身は北海道です。趣味は中学から始めたバレーボールと大学から始めた演劇です。大阪大学理学部物理学科を卒業後、人間理解と教育分野への興味から、アンドロイド(人間酷似型ロボット)の先進的研究で知られる大阪大学石黒研究室に進学しました。現在は同研究室の博士後期課程学生として、ロボットを用いて自分の考えを打ち明けやすい気楽な対話場面を実現するための研究に取り組んでいます。この研究以外の時間では、空耳自動生成プログラムを始めとする人を楽しませるためのプログラムの開発や、人と関わることが好きなのでサイエンスコミュニケーションのイベントなどを不定期に開催するなどしています。

研究計画

以下のスケジュールで研究を進めていきます。

2018年12月 クラウドファンディング挑戦
2019年2月 Webアプリページ公開、被験者実験
2019年8月 情報処理学会HCI研究会にて成果発表(予定)

リターンの説明

1,000円
(税抜)

注目のリターン:研究報告レポート(PDF版)

  1. 研究報告レポート(PDF版)
1000

空耳研究の詳細な進捗などをレポートにまとめてお送りします。応援よろしくお願いいたします!

現在、12人のサポーターが支援しています。

(数量制限無し)

3,000円
(税抜)

注目のリターン:オリジナルクリアファイル

  1. オリジナルクリアファイル
  2. 研究報告レポート(PDF版)
3000

オリジナルデザインのクリアファイルをお送りいたします! ※画像はデザインイメージです。

現在、6人のサポーターが支援しています。

(数量制限無し)

5,000円
(税抜)

注目のリターン:Webサイトにお名前掲載

  1. Webサイトにお名前掲載
  2. オリジナルクリアファイル
  3. 研究報告レポート(PDF版)
5000

Webサイトにサポーターとしてお名前を掲載いたします。応援よろしくお願いいたします!

現在、10人のサポーターが支援しています。

(数量制限無し)

10,000円
(税抜)

注目のリターン:サイエンスカフェ参加権

  1. サイエンスカフェ参加権
  2. Webサイトにお名前掲載
  3. オリジナルクリアファイル
  4. 研究報告レポート(PDF版)
10000

サイエンスカフェにご招待いたします。日時は2019年5月頃、場所は大阪を予定しています。当日は空耳研究と専門課程でやっているコミュニケーションロボット研究についてお話させていただきますので、ご参加をお待ちしています! ※当日ご参加いただけない場合には、後日資料を共有させていただきます。

現在、3人のサポーターが支援しています。

(数量制限無し)

30,000円
(税抜)

注目のリターン:学会発表資料の謝辞にお名前掲載

  1. 学会発表資料の謝辞にお名前掲載
  2. サイエンスカフェ参加権
  3. Webサイトにお名前掲載
  4. オリジナルクリアファイル
  5. 研究報告レポート(PDF版)
30000

2019年8月の情報処理学会HCI研究会にて本研究に関する発表をする際、謝辞にお名前を掲載させていただきます。また、発表資料(電子版)を送付いたします。お力をお貸しください。応援よろしくお願いいたします! ※学会発表が叶わなかった場合、その後の学会発表資料の謝辞にお名前を掲載いたします。

現在、0人のサポーターが支援しています。

(数量制限無し)

このプロジェクトは、
2019年03月05日 19時00分までに目標金額 200,000円を達成した場合のみ、決済が確定します。

お支払について

academistでのお支払はクレジットカード(VISA, Mastercard)をご利用頂けます。

Available cards

銀行振込をご希望の方は、こちらのフォームよりご連絡ください。

セキュリティについて

当サイトはSSL暗号化通信に対応しておりますので、入力した情報は安全に送信されます。
1,000円 (税抜)
  1. 研究報告レポート(PDF版)

1000

12人が支援しています。
( 数量制限無し )

3,000円 (税抜)
  1. オリジナルクリアファイル
  2. 研究報告レポート(PDF版)

3000

6人が支援しています。
( 数量制限無し )

5,000円 (税抜)
  1. Webサイトにお名前掲載
  2. オリジナルクリアファイル
  3. 研究報告レポート(PDF版)

5000

10人が支援しています。
( 数量制限無し )

10,000円 (税抜)
  1. サイエンスカフェ参加権
  2. Webサイトにお名前掲載
  3. オリジナルクリアファイル
  4. 研究報告レポート(PDF版)

10000

3人が支援しています。
( 数量制限無し )

30,000円 (税抜)
  1. 学会発表資料の謝辞にお名前掲載
  2. サイエンスカフェ参加権
  3. Webサイトにお名前掲載
  4. オリジナルクリアファイル
  5. 研究報告レポート(PDF版)

30000

0人が支援しています。
( 数量制限無し )