2019年02月20日 10時00分

Source: Hitachi, Ltd.

タイ国立プリンス・オブ・ソンクラー大学と日立、タイ語の感性分析エンジンを共同開発
1億語におよぶタイ語データベースに基づき、ソーシャルメディア特有の口語表現に対応する感性分析を実現

東京, 2019年02月20日 - (JCN Newswire) - タイ王国国立大学Prince of Songkla University(プリンス・オブ・ソンクラー大学、本校:タイ王国(以下、タイ)ハートヤイ郡/以下、PSU)プーケット校と、株式会社日立製作所(執行役社長兼CEO:東原 敏昭/以下、日立)は、このたび、タイ語の自然言語処理*1分野において共同研究を開始し、研究の第一フェーズとして、AIを活用してタイ語文書を「ポジティブ」「ネガティブ」「ニュートラル」に分類できる感性分析エンジンのプロトタイプを開発しました。

本エンジンは、ソーシャルメディアから収集した約1億語のタイ語データをもとに精緻化した感性辞書で分析を行うため、特殊な口語表現が多く、他言語に比べ処理が難しいことで知られる、ソーシャルメディアでのタイ語表現に対応する高精度な感性分析を実現します。

今後、実用化に向け、FacebookやTwitterなどソーシャルメディアから発生するリアルタイムデータを活用してプロトタイプの評価を共同で行い、2019年4月より日立の「感性分析サービス」*2において実装する予定です。

モバイル端末が爆発的に普及するタイでは、約6,900万人の人口に対し、Facebookを5,000万人、Twitterを1,200万人が利用する*3などソーシャルメディアの普及率が高い国のひとつであり、ソーシャルメディアを活用し、タイの国民性を考慮したサービスや商品の開発が求められています。その一方で、特殊な口語表現の多いタイ語では、テキスト処理が困難な綴りや長音符*4、擬音語に近い新しい造語や絵文字が頻繁に利用されることから、活用に際しては表記ゆれを補正するための膨大な事前処理が必要となります。

PSUは、ソーシャルメディアから収集した約1億語のタイ語データを精査し、大規模・高精度なタイ語感性辞書を構築するなど、タイ語言語処理分野で数少ない有数の研究機関のひとつです。日立では、2018年10月より、日本語の各種メディアや会話記録から、顧客の声を約1,300種類の話題・感情・意図に分類できる「感性分析サービス」を提供しています。

今回共同開発したエンジンは、PSUの研究成果と、日立が大規模システム開発で培ったアーキテクチャ設計ノウハウやデータ処理技術を組み合わせ、実現したものです。機械学習など複数の技術をかけ合わせたハイブリッドなノイズ除去機能と、PSUが構築した大規模・高精度な感性辞書により、タイ語のソーシャルメディアで特有の多様な表現や綴りに対応した感性分析が可能となります。

今後、PSUと日立は、リアルタイムデータを使ったエンジンの性能検証を共同で進め、感性を7段階評価*5にするなど分析精度をさらに精緻化し、2019年4月より日立からサービス提供を開始します。また、その後も共同研究を継続し、文脈を考慮した感性付与など分析エンジンのさらなる高度化に取り組んでいきます。

日立の「感性分析サービス」について

今回共同開発したタイ語感性分析エンジンは、日立の「感性分析サービス」のタイ語版として2019年4月より提供開始します。タイのアマタシティ・チョンブリ工業団地内に開設した「Lumada Center Southeast Asia」を現地の紹介拠点として活用し、日立アジア(タイランド)社(Hitachi Asia (Thailand) Co., Ltd.)が中心となり、自動車メーカーやホテル、病院、銀行、公共機関など日系企業の現地拠点やタイ現地企業に向けて本サービスを広く展開していきます。

なお、2019年4月のタイ語版サポートと同時に、英語・中国語にも対応するほか、順次、その他の言語にも拡大するなど、サービスの多言語対応を進める予定です。

本リリースの詳細は下記URLをご参照ください。
http://www.hitachi.co.jp/New/cnews/month/2019/02/0220.html

概要:日立製作所

詳細は www.hitachi.co.jp をご参照ください。

Source: Hitachi, Ltd.
セクター: エレクトロニクス, IT

Copyright ©2024 JCN Newswire. All rights reserved. A division of Japan Corporate News Network.


Latest Release

More Latest Release >>