60-think|Senior blog, CMS and SNS community site

2026/03/23

Think-AI Agent

音声：

①リアル

②STT⇒TTS＋翻訳

画像：

現在Think-AIのAgentの機能：

概要：

Model：Qwen、Chatgpt、Gemini。三つはMultiModal対応でき、チャットだけで自動Agentに振分け。

Deepseek対応（非MultiModal）。初期はQwenに設定されている、無料試すModelが多くて、検証にベスト。

リアル検索：trivyを使い、会話中自動呼び出す。天気、株、その他リアル情報

普通のChatbot機能
リアルタイム会話（各言語、また中国地方方言対応、上海、四川、粤语、天津など）
短い会話（会話⇒回答繰り返し）同時にテキスト出力も、翻訳、音声ファイル生成など
画像生成（テキスト⇒画像、画像合成（テキスト、複数画像⇒画像）
画像識別（テキスト抽出、画像のものを判別など）
生成されたものが自動保存し、画像、音声ファイルを自分のGalleryに保存、参照可能
携帯、PC対応、多言語対応