アラブ人情報科学研究者、完全な機械翻訳装置の開発目指す
2012年06月01日付 al-Hayat 紙


■アラブ人研究者のサリーム・ルーコス博士、言語システムを構築し、言語をデジタル処理

2012年6月1日『アル=ハヤート』

【本紙:アリー・ハウィーリー】

「話す、書く以外の方法で、考えを表現することはできるだろうか」。この問いは、コンピュータ・情報革命に先駆けて1957年に、米言語学者ノーム・チョムスキーが投げかけたものだ。しかし、チョムスキーは、自らが他の科学者たちに、一つの道筋を示したということを認識してはいなかっただろう。その道筋とは、コンピューター・システムの構築において、新たな方式とその利用を探るもので、そのシステムとは、人が日常使っている言語を直接処理するものだ。このような研究には、「自然言語処理」という専門用語が適用された。米・レバノンの科学者、サリーム・ルーコス博士(57歳、トリポリ生まれ)は、30年余りにわたって、コンピュータと人間の言語との結びつきに依拠する、このような関係に魅せられてきた。博士は、コンピュータ産業における一大企業、米国「IBM」社で勤務していた際、統計的言語モデルの構築とその分析、情報検索方式、自動機械と自然言語システム間のコミュニケーション言語理解などに取り組む部署に配属された。

音声…音声とそれ以上のもの

ルーコス博士は、ベイルート・アメリカン大学を卒業し、電子工学の学士号を取得。1978年から1980年にかけて、フロリダ大学で、通信・電気信号システムを専門に、修士号・博士号を取得した。専門職生活は、マサチューセッツ州のケンブリッジにある大学で始まり、コンピュータ科学、デジタル翻訳分野の兼任教授・研究員を勤めた。1989年、170カ国に40万人の社員を抱えるIBMに入社。デジタル翻訳の改善に取り組むグループで働いた。さらに、世界の諸言語、数学、統計、コンピュータ・プログラミングを専門とする他のグループにも参加した。後者のグループは、数年前に「n.Fluent」として名を馳せた自動翻訳プログラムの構築に従事した。現在、博士は、IBMで自然言語システムを担当する部署を統括している。

また、現在、ルーコス博士は、「ワトソン研究センター」の「デジタル翻訳」の実行責任者として、音声圧縮、時間スケール変換、コミュニケーション中の言語判定、文中の単語配置、話し言葉の理解などの技術開発を指揮している。

ルーコス博士は、本紙とのインタビューで、自身が製造、精緻化、改良に関わっているテクノロジープロジェクトの説明を始めた。博士は、「音声認識」技術に言及した。同技術は、ユーザが特定の言語でコンピュータに話しかけると、ユーザが望む言語にコンピュータが翻訳して返答するというものだ。このプロジェクトへの取り組みは、約10年もの年月を要した。博士は、人間の声とコンピュータの関係は、今始まりつつあるとの見解を示した。発話は、マイクロフォン、あるいはサウンドカードに接続された無線を通して、コンピュータに直接発せられる。つまり、コンピュータは、人間の「対談者」が発する言葉を、明確な数式やデジタルスケールに変換するのだ。これによって、コンピュータは、発せられた言葉を「認識」することができる。その上で、言語として適切な「返答」を生成する。博士は、同様に、様々な情報システムと自動機械間のこの試みについて語った。

言葉と言葉を自動で結ぶ「橋」

ルーコス博士は、言語間の自動翻訳分野において、更なる業績を上げた。博士は、30にわたる言語を翻訳できる電子プログラムの開発に至ったと明らかにした。同プログラムは、80%近くの人々が話す複数の言語に有効性を示しており、中には、フランス語、アラビア語、中国語を英語に翻訳するものもある。また、これらの翻訳は、インターネットを通した直接的な対話で、実用化されていると指摘した。同様に、これらの言語で交わされた会話を、直接的に、無料で、英語に翻訳できることから、「チャットルーム」で交わされている言葉も処理している。

ルーコス博士の研究は、デジタル形式で自動的に動作する言語操作を扱っている。これは、このような言語操作が、高速翻訳には「つきもの」だということを意味している。このプロジェクトには、統計処理、厳密計算、情報分析などの導入が含まれている。博士は、このプロジェクトに専念し、同プロジェクトを、正確性、速度、明確性、質を特徴とする完全な機械翻訳システムの革新だとみなした。さらに、この研究は、商業、学術分野、テキスト通信などにおいて、実用的に用いられていると述べた。博士は、これに関して、企業が、自社の取引に伴う翻訳作業において高いコストの伴う翻訳作業を断念し、博士が開発した高速デジタル翻訳プログラムに依存する方向に切り替えているという例を挙げて指摘し、最後に、同プログラムは、世界的に広く普及したということに言及した。

同様に、ルーコス博士は、特にテレビ放送分野における娯楽分野での一部の活動などに加えて、同プログラムの恩恵を受けているものの中には、研究者や文書翻訳の専門家も含まれる、と明らかにした。彼らは全て辞書を放棄し、コンピュータとインターネットを通して、正確で、瞬時に翻訳を提供できる同プログラムの性能を選んだ。博士は、これらの規則が、言語専門家やコンピュータ科学専門家、プログラマー、統計や複雑な計算データの分析家によるネットワークを礎としていると明らかにした。また、彼らは、翻訳の曖昧性解消、音声や朗誦の研究や、これらに関連する言語・技術的問題の解決のため、一つのグループとして活動している。

ルーコス博士は、インターネットを介して翻訳された文書に対して、世間から受けた批判に取り組んだ。この批判とは、翻訳された文書が、時々本文に即しておらず、一部には、笑いを誘うような訳や、意味が通らない訳もあることから来たものである。博士は、一部のコンピュータアプリケーションは、単語ごとに逐語訳をしている。これは、最もよく使われる意味を、他の言語の単語に直接移すだけのもので、美しく表現するための意味の吟味や手法を欠いていると指摘した。また、自動翻訳は、ラテン系の言語同士で処理する場合、常に明確だと主張した。

ルーコス博士は、複数の自動翻訳プログラム間で発生する差を無くすことに関して、人間による翻訳により近づけるため、先進の自然言語の翻訳技術を用いた包括的な戦略を打ち立てようとしていると注意を促した。続けて、「私は、多くの難問を抱えている話し言葉を翻訳することを目的とした、新たな自動翻訳プログラムに取り組んでおり、すでに、このプロジェクトの約60%を遂行した。また、向こう数年で、技術的、科学的、文学的に発展することを期待している。これは、機械翻訳が、知識を深める一部となるために、その欠陥を埋める手助けとなる」と述べた。

IBMの文書は、ルーコス博士が「国際会議を通しての創造的な貢献、研究活動、米国や世界のメディアで刊行されたインタビューを通して、世界的な地位や知識を有している。さらに、米国で登録された、質の高い特許を保有している」と指摘している。

ルーコス博士は、アラブ世界との協力に関して、IBMのグループと、サウジアラビア王国テクノロジーセンター、カイロ大学、アラブ首長国連邦(UAE)のグループによる共同研究の存在を明言した。これらの努力そのものには、技術協力や、両グループ間の経験の交換が含まれている。博士は、これらの努力に直接関わることに関心を示し、まさにこの案件に関する会議に参加したと述べた。同会議は、ニューヨークで開催された。

Tweet
シェア


この記事の原文はこちら
原文をPDFファイルで見る
原文をMHTファイルで見る

 同じジャンルの記事を見る


( 翻訳者:井上剛 )
( 記事ID:26588 )