第1回:毎日の献立問題をデータで解く
約2万件のレシピデータを3つのCSVソースから統合し、機械学習で献立提案を行うためのデータパイプラインを構築した過程を解説します。
読む →
「NLP」タグの記事(6件)
約2万件のレシピデータを3つのCSVソースから統合し、機械学習で献立提案を行うためのデータパイプラインを構築した過程を解説します。
19次元の栄養素ベクトルにコサイン類似度を適用し、栄養バランスが似ている別の料理やメニューを検索する仕組みを解説します。
コサイン類似度では解決できなかった「献立のマンネリ」問題に、LSTMによる時系列予測で挑みます。テキスト生成の発想を献立提案に転用した実装の全記録。
数年後、LLMの登場で同じプロジェクトを再訪。ChatGPT APIを使い、2万件のレシピを忙しい家庭向けの時短版に一括変換した実装記録。
翻訳用LLMプロバイダとしてDeepSeekを導入したところ、処理速度・中国語混入・入力データ漏洩の3つの問題が発生。ChatGPTへの統一に至った経緯と、LLMプロバイダ選定の教訓をまとめます。
MeCab形態素解析と感情辞書を使い、Twitterのツイートをポジティブ・ネガティブにスコアリングする辞書ベースの感情分析ツールの構築記録。