言語資源

日英翻訳エンジン学習・評価用対訳コーパス

IWSLT(International Workshop on Spoken Language Translation)の2005年評価キャンペーンの日英翻訳で使用された基本旅行会話データセットに基づいて作られたコーパスで、翻訳機器学習用データ20,000文、評価用データ1,500文(日英対訳文)から構成されています。

本データセットはALAGINよりダウンロードしてください。
なおALAGINからのダウンロードに際しては、ALAGINへの会員登録が必要です。