gihyo.jp
openSUSE.Asia組織委員会は、年次カンファレンス「openSUSE.Asia Summit 2024」を2024年11月2日(土)、3日(日)の2日間、(株)SHIFT(東京・麻布台ヒルズ)にて開催する。…
openSUSE.Asia組織委員会は、年次カンファレンス「openSUSE.Asia Summit 2024」を2024年11月2日(土)、3日(日)の2日間、(株)SHIFT(東京・麻布台ヒルズ)にて開催する。…
[REF]:
https://zenn.dev/ubie_dev/articles/26a97f8cddbf80
前回は、第6回 音声書き起こしとプロンプト処理を連携するについて説明しました。今回は、リアルタイム文字起こしに関して説明します。…
[REF]:
https://www.watch.impress.co.jp/docs/news/1649603.html
Googleはビジネス・企業向け生成AIサービス「Gemini for Google Workspace」の体験会を開催した。同体験会では、Geminiを利用した、メールやアンケート業務、誤字脱字チェックなど、業務効率化と品質向上に役立つ多様なユースケー…
[REF]:
https://techblog.enechain.com/entry/transcription-using-gemini-and-cloud-speech-to-text
こんにちは。enechainで統計・機械学習モデルの構築やLLM(大規模言語モデル)の活用推進を担当している@udon_tempuraです。…
[REF]:
https://cloud.google.com/sdk/docs/install?hl=ja
このページでは、Google Cloud CLI のインストールの選択と維持のための手順について説明します。Google Cloud CLI には gcloud、gsutil、bq コマンドライン ツールが含まれています。gcloud CLI の機能の一覧については、すべての機能を…
[REF]:
https://zenn.dev/google_cloud_jp/articles/b0c11be3fa147b
この記事は Google Cloud Japan Advent Calendar 2024 (Gemini特集版) の 18 日目の記事です。 本記事では Google Cloud の Vertex AI で行う Gemini モデルのチューニングについて記載しています。 Gemini モデルのチューニングについて LLM を活用し…
[REF]:
https://zenn.dev/shu223/articles/soundanalysis-builtin
Sound Analysis(SoundAnalysisと表記されることも)は、音声解析のためのフレームワークです。ディープラーニングで音声を分類/識別することができます。…
[REF]:
https://note.com/nyosubro/n/n07afba435ef6
Gemini 1.5 Pro on #VertexAI also supports processing audio inputs – including music, speech, and even the audio portion of videos. 🎵 This means it can give high-quality transcriptions or be used to search & analyze multimodal content. → https://t.co/CLMN3wNmeP #GoogleCloudNext pic.twitter….
[REF]:
https://darekasan-net.hatenablog.com/entry/2024/09/04/152918
ちなみにUSB接続のものはNVMeをUASPに変換する上位のレイヤーで動く存在なので使えない。ひょっとしたらUSBとThunderbolt両対応のものも調子が悪いかも。…
[REF]:
https://av.watch.impress.co.jp/docs/series/dal/1339983.html
Digital Audio Laboratoryの記事内で、オーディオインターフェイスを取り上げる際に必ずチェックしているのが「レイテンシー」だ。レイテンシーとはオーディオインターフェイスで音を再生したり、録音したりする際に起こる遅…