第4回(補足)個人開発でできるリアルタイム翻訳 - Bluetoothイヤホンで翻訳を聞く
翻訳パイプラインへのTTS追加の実装記録:Web Speech APIのコード、モバイルブラウザの回避策、Bluetoothオーディオルーティング、そしてネイティブアプリへの道筋。
読む →
「AI」タグの記事(58件)
翻訳パイプラインへのTTS追加の実装記録:Web Speech APIのコード、モバイルブラウザの回避策、Bluetoothオーディオルーティング、そしてネイティブアプリへの道筋。
RTX 3060でのローカルLLM検証:Ollamaのセットアップとクラッシュ、LM Studio 0.4.0のヘッドレスCLI、並列リクエスト制御のロック機構、モバイルLLMの実現可能性調査、そして多言語対応ガイド。
核心の実装:速度と品質を切り替えるデュアルプロンプト、ストリーミングJSON抽出、デバウンス処理、段階的表示のフロントエンド — コード付き。
既存の音声翻訳アプリが会話を壊す理由と、Deepgram・FastAPI・WebSocketで翻訳機の基盤を構築する方法。