個人開発でもリアルタイム翻訳はつくれる
ストリーミングLLM・Deepgram・WebSocketを使い、リアルタイムに近い音声翻訳機を個人開発で構築する実践ガイド。
4記事
第1回
第1回 個人開発でできるリアルタイム翻訳 - 「沈黙」を打破するIntent-First
既存の音声翻訳アプリが会話を壊す理由と、Deepgram・FastAPI・WebSocketで翻訳機の基盤を構築する方法。
続きを読む →
第2回
第2回 個人開発でできるリアルタイム翻訳 - 500msを実現するLLMストリーミング
核心の実装:速度と品質を切り替えるデュアルプロンプト、ストリーミングJSON抽出、デバウンス処理、段階的表示のフロントエンド — コード付き。
続きを読む →
第3回
第3回 個人開発でできるリアルタイム翻訳 - Ollama・LM Studio・自宅GPUの限界
RTX 3060でのローカルLLM検証:Ollamaのセットアップとクラッシュ、LM Studio 0.4.0のヘッドレスCLI、並列リクエスト制御のロック機構、モバイルLLMの実現可能性調査、そして多言語対応ガイド。
続きを読む →
第4回
第4回(補足)個人開発でできるリアルタイム翻訳 - Bluetoothイヤホンで翻訳を聞く
翻訳パイプラインへのTTS追加の実装記録:Web Speech APIのコード、モバイルブラウザの回避策、Bluetoothオーディオルーティング、そしてネイティブアプリへの道筋。
続きを読む →