AI「音声認識」(39ページ中3ページ目)

人気声優・梶裕貴の声で自由に喋らせるソフトを3日間限定で先行受注販売 「無断AIカバー」に対抗し二次創作に新たな風を 画像
音声認識

人気声優・梶裕貴の声で自由に喋らせるソフトを3日間限定で先行受注販売 「無断AIカバー」に対抗し二次創作に新たな風を

目覚ましい進化を遂げる一方、様々な分野で議論を巻き起こしているAI。先の見えない未来の技術と共存するべく、声を生業とする声優・梶裕貴氏が、自身の声をオフィシャルに活用できる音声合成ソフトを発表した。梶裕貴氏は『進撃の巨人』のエレン・イェーガー役などで知…

約100言語に対応したリアルタイム翻訳機能をアバター接客サービスで提供開始 AIを活用した言語の自動検出機能も搭載 AVITA 画像
音声認識

約100言語に対応したリアルタイム翻訳機能をアバター接客サービスで提供開始 AIを活用した言語の自動検出機能も搭載 AVITA

代表取締役社長 CEO/CTOを大阪大学の石黒浩氏がつとめるAVITA株式会社は、同社が提供しているアバターオンライン接客サービス「AVACOM」において、リアルタイム翻訳できる「翻訳機能」をリリースした。

「AVACOM」では、これまでも多言語対応可能なスタッフの手配サ…

運転免許申請手続きを多言語で対応するため、字幕表示システム「Cotopat」を導入 リアルタイム翻訳機能を活用 福岡県警察 画像
音声認識

運転免許申請手続きを多言語で対応するため、字幕表示システム「Cotopat」を導入 リアルタイム翻訳機能を活用 福岡県警察

京セラドキュメントソリューションズジャパン株式会社は、話した言葉をリアルタイムに認識して文字や図解、翻訳を表示するシステム「Cotopat Screen」が、福岡県警察の自動車運転免許試験場4施設(福岡、北九州、筑豊、筑後)に採用され、運用が開始されたことを発表した…

明日花キララといつでもLINEで会話できる「Kirara.AI」をリリース キララ本人の性格や声色、話し方、文章を最大限再現 画像
音声認識

明日花キララといつでもLINEで会話できる「Kirara.AI」をリリース キララ本人の性格や声色、話し方、文章を最大限再現

neverspaceは、実在する芸能人やインフルエンサーとAIなどを用いて疑似的な会話を体験できるサービス「Communicaiton.AI」の提供を2024年3月29日より開始。その第一弾として、タレントの明日花キララさんとLINE上で会話ができるAIコミュニケーションサービス「Kirara.AI…

櫻坂46メンバーが中国語を話す?NTT西日本がクロスリンガル音声合成とソニー「Sound AR」を連携 声質そのままで中国語に変換 画像
音声認識

櫻坂46メンバーが中国語を話す?NTT西日本がクロスリンガル音声合成とソニー「Sound AR」を連携 声質そのままで中国語に変換

NTT西日本は、アーティストやアニメ等の音声価値に着目し、位置情報と音声情報を組み合わせ、特定の場所に行けば、設定された音声が流れる「音声AR」を活用した「日本のエンターテイメントのグローバル展開」と「旅行者の観光体験や楽しみ」両方の拡大をめざす実証実験…

エーアイ、Cerenceが提供する超小型音声認識エンジン・オーディオ信号処理技術を提供開始 極少リソースで音声による機器操作を実現 画像
音声認識

エーアイ、Cerenceが提供する超小型音声認識エンジン・オーディオ信号処理技術を提供開始 極少リソースで音声による機器操作を実現

エーアイは技術提携先であり、自動車を含むコネクテッドモビリティの世界へ独自のソリューションを提供し、感動的なユーザー体験を創出するグローバル・リーダーであるCerence Inc.(セレンス)が提供する超小型音声認識エンジン(Input AI Lite)・オーディオ信号処理…

「音声認識AIカオスマップ2024」を公開 合計161サービスの音声認識AIの製品・サービスを7用途に分類 画像
音声認識

「音声認識AIカオスマップ2024」を公開 合計161サービスの音声認識AIの製品・サービスを7用途に分類

AIポータルメディア「AIsmiley」を運営するアイスマイリーは、各業界のDX推進の支援の一環として合計161サービスの音声認識AIの製品、サービスをまとめた「音声認識AIカオスマップ2024」を2024年2月6日に公開した。

カオスマップ作成の背景
近年、OpenAI社のChatGPT…

ドコモ「誰でも簡単にデジタル空間に分身が持てる」大規模言語モデル(LLM)、個人性を再現する対話技術、数分で音声合成できる「Another Me」のデモ公開 画像
音声認識

ドコモ「誰でも簡単にデジタル空間に分身が持てる」大規模言語モデル(LLM)、個人性を再現する対話技術、数分で音声合成できる「Another Me」のデモ公開

NTTドコモは、デジタル分身のプロトタイプをメタコミュニケーションサービス「MetaMe」上に実装したデモを、2024年1月17日から東京国際フォーラムにて開催された「docomo Open House’24」で展示した。冒頭の画像は「邪神ちゃんドロップキック」のキャラクターの分身を…

VTuberの声そのままに多言語に自動翻訳して発声『ファンボイス翻訳』 VTuber事務所『ななはぴ』と協業、海外ファン層の拡大へ 画像
音声認識

VTuberの声そのままに多言語に自動翻訳して発声『ファンボイス翻訳』 VTuber事務所『ななはぴ』と協業、海外ファン層の拡大へ

ピカブルは、VTuber事務所『ななはぴ』とのVTuberの海外展開における協業を開始すると発表した。
この協業は『ななはぴ』所属VTuberの海外ファン層拡大を目的とし、ピカブルが提供する多言語吹替サービス『ファンボイス翻訳』を活用することで、海外のファン層に向けた…

「ポケトーク for BUSINESS 同時通訳」にウェブブラウザ版が登場!ブラウザ起動してハンズフリーで音声と字幕で通訳 画像
その他

「ポケトーク for BUSINESS 同時通訳」にウェブブラウザ版が登場!ブラウザ起動してハンズフリーで音声と字幕で通訳

ポケトーク株式会社は「ポケトーク for BUSINESS 同時通訳」ウェブブラウザ版の提供を開始することを2023年11月9日に発表し、同日に提供を開始した。
ウェブブラウザで使えるようになることで、一般のスマホやタブレットで自動翻訳機能が使用できるようになり、翻訳デ…

音声データの可視化が可能!画像生成AI活用ツール「生成AI GO」に「GPT-4」を活用した音声解析機能を実装 フューチャースタンダード 画像
音声認識

音声データの可視化が可能!画像生成AI活用ツール「生成AI GO」に「GPT-4」を活用した音声解析機能を実装 フューチャースタンダード

AI技術の進歩はクリエイティブ分野やビジネス、教育、研究など多岐にわたり注目されている。
その中でも、音声認識やテキスト変換の技術は大きく進展しており、実際の会議などの音声をテキスト化・マインドマップ化することで、議事録の作成などの労力を削減することが…

次世代リアルタイム翻訳が普及すると映像配信やコメント欄の言葉の壁を超えてグローバル展開へ Sparticleの「Felo字幕」の事例 画像
生成AI

次世代リアルタイム翻訳が普及すると映像配信やコメント欄の言葉の壁を超えてグローバル展開へ Sparticleの「Felo字幕」の事例

リアルタイム翻訳によって映像配信や音声対話、テキスト投稿などが言語の壁を越えたグローバルなステージへと展開しようとしている。例えばmeta(旧Facebook)は「SeamlessM4T」でこの分野に本格的に展開することを発表している。日本語で話した配信者の発話がリアルタイ…

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 10
  10. 20
  11. 30
  12. 最後
Page 3 of 39