Sustainable Japan | 世界のサステナビリティ・ESG投資・SDGs

【国際】メタ、AIによる言語消滅リスクに対応。対応言語を増やすことで文化保全

 IT世界大手米メタ・プラットフォームズは5月22日、世界の多様な言語を識別できるAIモデルを複数発表した。同社のVRやAR、SNS等のサービス等に展開される。

 同社は今回、言語解析AIが普及していく中で、特定の言語にソリューションが集中し、世界の多くの言語が消滅してしまるリスクに着目。数多くの言語に対応できるようにすることで、世界の言語文化の保全に動く。

 今回の発表では、同社の大規模多言語音声(MMS)モデルで、音声合成や音声読み上げの技術を従来の約100言語から10倍以上の1,100言語以上に拡張。音声言語識別でも、従来の40倍以上の4,000以上に拡張する。
 
 同モデルの開発では、研究コミュニティ等と協働。何千もの言語の音声データを収集することが課題となったが、聖書のような宗教的なテキストを利用することを着想。宗教テキストの翻訳書には、異なる言語で朗読する音声記録が公開されており、1,100以上の言語による新約聖書の朗読のデータセットを作成。1言語あたり平均32時間のデータを獲得した。

 さらに、様々なキリスト教の宗教的な朗読のラベルなし録音を考慮することで、利用可能な言語数を4,000以上にまで増やすことに成功。収集したデータは男性の声が大半だったが、女性の声でも十分に機能したという。宗教的な言語を生成するような過学習が発生していないこともチェックした。

 同社は、開発したモデルとコードをオープンソースで提供する。今後も対応言語を増やしていく考え。

【参照ページ】Preserving the World’s Language Diversity Through AI

ここから先は登録ユーザー限定のコンテンツとなります。ログインまたはユーザー登録を行って下さい。

 IT世界大手米メタ・プラットフォームズは5月22日、世界の多様な言語を識別できるAIモデルを複数発表した。同社のVRやAR、SNS等のサービス等に展開される。

 同社は今回、

ここから先は登録ユーザー限定のコンテンツとなります。ログインまたはユーザー登録を行って下さい。

 IT世界大手米メタ・プラットフォームズは5月22日、世界の多様な言語を識別できるAIモデルを複数発表した。同社のVRやAR、SNS等のサービス等に展開される。

 同社は今回、

ここから先は登録ユーザー限定のコンテンツとなります。ログインまたはユーザー登録を行って下さい。

ここから先は有料登録会員限定のコンテンツとなります。有料登録会員へのアップグレードを行って下さい。

 IT世界大手米メタ・プラットフォームズは5月22日、世界の多様な言語を識別できるAIモデルを複数発表した。同社のVRやAR、SNS等のサービス等に展開される。

 同社は今回、言語解析AIが普及していく中で、特定の言語にソリューションが集中し、世界の多くの言語が消滅してしまるリスクに着目。数多くの言語に対応できるようにすることで、世界の言語文化の保全に動く。

 今回の発表では、同社の大規模多言語音声(MMS)モデルで、音声合成や音声読み上げの技術を従来の約100言語から10倍以上の1,100言語以上に拡張。音声言語識別でも、従来の40倍以上の4,000以上に拡張する。
 
 同モデルの開発では、研究コミュニティ等と協働。何千もの言語の音声データを収集することが課題となったが、聖書のような宗教的なテキストを利用することを着想。宗教テキストの翻訳書には、異なる言語で朗読する音声記録が公開されており、1,100以上の言語による新約聖書の朗読のデータセットを作成。1言語あたり平均32時間のデータを獲得した。

 さらに、様々なキリスト教の宗教的な朗読のラベルなし録音を考慮することで、利用可能な言語数を4,000以上にまで増やすことに成功。収集したデータは男性の声が大半だったが、女性の声でも十分に機能したという。宗教的な言語を生成するような過学習が発生していないこともチェックした。

 同社は、開発したモデルとコードをオープンソースで提供する。今後も対応言語を増やしていく考え。

【参照ページ】Preserving the World’s Language Diversity Through AI

ここから先は登録ユーザー限定のコンテンツとなります。ログインまたはユーザー登録を行って下さい。