signs_ai
signs_aiは、NVIDIAが主導するコミュニティ主導のAIプロジェクトで、包括的なアメリカ手話(ASL)データセットの作成を目指しています。短い手話のビデオ録画を投稿することで、AIモデルがASLをより良く理解するためのトレーニングを支援し、ろう者・難聴者コミュニティのコミュニケーションアクセシビリティを向上させることができます。このイニシアチブは、次世代の支援技術を支える多様で偏りのないデータセットの構築に焦点を当てています。
signs_aiは、NVIDIAが主導するコミュニティ主導のAIプロジェクトで、包括的なアメリカ手話(ASL)データセットの作成を目指しています。短い手話のビデオ録画を投稿することで、AIモデルがASLをより良く理解するためのトレーニングを支援し、ろう者・難聴者コミュニティのコミュニケーションアクセシビリティを向上させることができます。このイニシアチブは、次世代の支援技術を支える多様で偏りのないデータセットの構築に焦点を当てています。
コミュニケーションについて
AIコミュニケーションツールは、発話、言語、または聴覚に障害を持つ個人が自己表現し、他者と対話するのを支援するために設計された、支援技術の専門的なカテゴリです。テキスト読み上げ(TTS)、音声認識(STT)、自然言語処理(NLP)などの先進技術を活用し、これらのツールはテキスト、シンボル、またはその他の入力を音声や読み取り可能なテキストに変換します。その主な価値は、コミュニケーションの障壁を取り除き、ユーザーの自立を促進し、より意味のある社会参加を可能にすることにあります。多くのツールは高度なパーソナライズ機能を提供し、カスタム語彙やパーソナライズされた合成音声の作成も可能です。
主な機能
- 拡大・代替コミュニケーション(AAC):シンボル、写真、テキストから音声を生成し、非言語的ユーザーをサポートします。
- リアルタイム文字起こし:聴覚障害を持つ個人のために、話された言語を即座に書き言葉に変換します。
- パーソナライズ付きテキスト読み上げ(TTS):書き言葉を自然な響きの音声に変換し、パーソナライズされた音声を作成するオプションも提供します。
- 予測テキストと文章作成:文脈に基づいて単語やフレーズを提案し、運動または言語に困難を抱えるユーザーのコミュニケーションを高速化します。
- 手話認識・翻訳:手話を解釈または生成し、ろう者と聴者のコミュニティ間のコミュニケーションを橋渡しします。
利用シーン
これらのツールは、コミュニケーション障害を持つ学生のための教育現場、言語療法のための臨床環境、そしてALS、脳性麻痺、自閉症、失語症などの状態を持つ個人の日常生活において不可欠です。専用デバイス、タブレット、スマートフォンで使用され、会話の促進、授業への参加、職場での対話を支援します。
選択のポイント
ツールを選択する際は、ユーザーの特定のコミュニケーションニーズ(例:表出的か受容的か)、身体的および認知的能力、必要な入力方法(タッチ、視線追跡、スイッチ)を考慮してください。また、ツールの語彙カスタマイズオプション、音声の品質とパーソナライズ機能、デバイスの互換性、他の支援技術との統合も評価する必要があります。
コミュニケーション利用シーン
非言語的な個人の日常的なコミュニケーション
非言語的な自閉症の個人が、タブレットベースのAACアプリケーションを使用します。一連の絵記号(例:「欲しい」+「りんご」+「ください」)をタップすることで、アプリはクリアな合成音声の文章を生成します。これにより、彼らは家族、教師、介護者に対してニーズ、欲求、感情を表現でき、フラストレーションを減らし、社会的相互作用を促進します。システムの予測ロジックは、一般的な日課に基づいて次に関連する記号を提案することもでき、コミュニケーションをより速く、より直感的にします。
難聴者のための会議へのリアルタイム参加
聴覚に障害のある専門家が、ビジネス会議中にスマートフォンやラップトップでAI搭載の文字起こしアプリを使用します。アプリはデバイスのマイクを通じて会話を聞き取り、リアルタイムでスクロールするテキストトランスクリプトを提供します。これにより、彼らは議論を正確に追い、重要な決定を理解し、重要な情報を見逃すことなく自分の意見を述べることができます。一部の高度なツールでは、異なる話者を識別することもでき、トランスクリプトをより追いやすくします。
変性疾患を持つ個人のための音声保存
最終的に発話に影響を与えるALS(筋萎縮性側索硬化症)のような神経変性疾患と最近診断された人が、ボイスバンキングツールを使用します。彼らは一連のフレーズを録音し、AIモデルが彼らの声のユニークな特徴を学習します。後で、彼らが話すことができなくなったとき、このパーソナライズされた合成音声をテキスト読み上げデバイスに統合することができ、彼らが自分自身のものとして認識できる声でコミュニケーションをとることを可能にし、彼らのアイデンティティの重要な部分を保存します。
脳卒中後の言語回復支援
失語症を経験している脳卒中サバイバーが、言語リハビリテーション用に設計されたコミュニケーションアプリを使用します。このツールは、予測的な文の開始部分やシンボルベースのコミュニケーショングリッドなどの機能を提供します。メッセージを作成しようとするとき、ユーザーが最初の数文字を入力すると、AIが文脈に関連する単語やフレーズを提案し、単語を見つける困難を克服するのを助けます。これは即時のコミュニケーションを容易にするだけでなく、言語経路を再構築するための治療ツールとしても機能します。
手話翻訳によるギャップの橋渡し
大学の講義で、ろう者の学生がAIツールを使用します。このツールは、教授の話す言葉をリアルタイムでタブレット上の3D手話アバターに翻訳します。逆に、デバイスのカメラを使って手話で質問をすることができ、ツールはその手話をテキストまたは合成音声に翻訳して教授が理解できるようにします。この技術は、人間の通訳が利用できない環境でシームレスな双方向コミュニケーションを促進し、より大きな教育的インクルージョンを推進します。
発語失行症の子供たちの支援
運動性言語障害である小児期発語失行症(CAS)の子供が、専門のセラピーアプリを使用します。アプリは目標の単語を提示し、AI搭載の音声認識を使用して、彼らの発音に関する即時の視覚的および聴覚的フィードバックを提供します。それは子供の試みを分析し、音の生成におけるエラーを強調表示し、より明瞭な発話へと導きます。このゲーム化されたインタラクティブなアプローチは、セラピーをより魅力的にし、子供が発話のための運動計画スキルをより効果的に構築するのを助けます。