検索結果
ジャンル
|
データセット名
|
説明 |
---|---|---|
言語資源 | 異表記対データベース |
文字レベルの編集距離の近い、日本語の語句の異表記対(あるいは「表記揺れの対」)の正例と負例を集めたものです。 本データセットはALAGINよりダウンロードしてください。 なおALAGINからのダウンロ…
|
音声資源 | 日英・日中バイリンガル独話音声データベース |
日英または日中のバイリンガルである声優または一般人が発声した音声コーパスです。 本データセットはALAGINよりダウンロードしてください。 なおALAGINからのダウンロードに際しては、ALAGINへ…
|
言語資源 | 文脈類似語データベース |
約100万の見出し語それぞれに対して、Web文書上での出現文脈が最も類似している名詞最大500個を類似度とともに列挙したものです。 本データセットはALAGINよりダウンロードしてください。 なおAL…
|
言語資源 | 負担・トラブル表現リスト |
「災害」「心理的ストレス」「アスベスト汚染」など社会活動に負荷を与えたり、マイナス効果をもたらす問題や障害に関係する表現、20,115件を収録したものです。 本データセットはALAGINよりダウンロー…
|
言語資源 | 単語共起頻度データベース |
各単語に対して、それとの意味的関連を表す共起スコアの高い単語を、スコアの高い順に、スコアとともに列挙したものです。 本データセットはALAGINよりダウンロードしてください。 なおALAGINからのダ…
|
言語資源 | 京都観光ブログの評価情報付与データ |
「京都観光ブログ」と京都観光ブログの「評価情報付与データ」から構成され、前者は京都観光を中心とした執筆者47名・合計1041記事(平均約480字)から構成される日本語ブログ記事のデータベースです。後者…
|
サイバーセキュリティ関連 | ダークネット・データセット2019 |
本データセットには,下記参照論文の解析に用いたダークネット統計データ及び解析結果データが含まれています。 ダークネット統計データ: NICTERダークネット・トラフィックデータから作成した統計データで…
|
言語資源 | 音声翻訳実証実験固有名詞対訳辞書 |
平成21年度「地域の観光に貢献する自動音声翻訳技術の実証実験」で採択された5つのプロジェクトにおいて収集した日・英・中・韓国語の固有名詞辞書をNICTで整備した辞書です。 本データセットはALAGIN…
|
脳情報関連 | Brain Viewer 2012 |
Brain Viewer 2012 は、人が知覚する様々な物体や動作カテゴリが大脳皮質のどこでどのように表現されているかを可視化するWebインターフェースです。様々な動画を視聴している際の全脳活動記録…
|
脳情報関連 | バイオロジカルモーション知覚の時空間特性を調べるための刺激呈示プログラムと行動データ |
このデータセットは,バイオロジカルモーション知覚の時空間的な脳内処理特性について明らかにした学術論文Chang, Troje, Ikegaya, Fujita, Ban 2021 Cortex で用い…
|
脳情報関連 | 自然動画視聴下ヒト脳活動データ(リンク先英文) |
このデータセットは約3時間分の動画を視聴している際のヒト視覚関連領域(後頭葉)における脳活動記録(fMRI記録)を提供するものです。 データセットはヒト3名分の脳活動データ、刺激動画データ、機能領野位…
|
言語資源 | 意見(評価表現)抽出ツール用モデル |
オープンソースソフトウェアとして配布されている「意見(評価表現)抽出ツール」のための意見解析用モデルファイルと評価表現辞書から構成されたモデルです。 本データセットはALAGINよりダウンロードしてく…
|
脳情報関連 | SIPS Probabilistic Atlas (繊維束のアトラスデータ) |
このデータは、94名の被験者から同定したヒト頭頂葉の線維束(stratum proprium of interparietal sulcus; SIPS)のMNI標準脳座標系での位置を示すアトラスデー…
|
言語資源 | 動詞含意関係データベース |
含意関係が成立している動詞のペア(52,689ペア)と含意関係が成立していない動詞のペア(68,819ペア)の計121,508ペアを列挙したものです。 本データセットはALAGINよりダウンロードして…
|
言語資源 | 日英翻訳エンジン学習・評価用対訳コーパス |
IWSLT(International Workshop on Spoken Language Translation)の2005年評価キャンペーンの日英翻訳で使用された基本旅行会話データセットに基づ…
|
言語資源 | 基本的意味関係の事例ベース |
約1億ページのWeb文書上において文脈の類似度が高い2語間の意味的関係を人手で分類し、ラベル付けした102,436語対を収録したものです。 本データセットはALAGINよりダウンロードしてください。 …
|
言語資源 | 日本語係り受けデータベース |
大量の日本語文書を係り受け解析した結果から係り受け関係を抽出し、その頻度を収録したものです。 本データセットはALAGINよりダウンロードしてください。 なおALAGINからのダウンロードに際しては、…
|
音声資源 | 日本語音声データベース |
ATRにて開発された、音素バランス文などの文や定形単語を発話内容とする、プロナレータによる多数話者日本語音声データベースです。 本データセットはALAGINよりダウンロードしてください。 なおALAG…
|
バイオ関連 | 細胞内タンパク質局在データ |
分裂酵母タンパク質の蛍光タンパク質タギングによる細胞内局在データです。
|
機械学習・量子機械学習 | 量子インスパイア正準相関分析(qiCCA) |
量子インスパイア正準相関分析(qiCCA)を実装したPythonライブラリです。 正準相関分析では、1対の多次元入力データに対して、互いの相関が高くなるような共通成分を求めます。従来アルゴリズムの問題…
|