2026/03/23
Think-AI Agent

音声:

①リアル

②STT⇒TTS+翻訳

現在Think-AIのAgentの機能:

概要:

Model:Qwen、Chatgpt、Gemini。三つはMultiModal対応でき、チャットだけで自動Agentに振分け。

Deepseek対応(非MultiModal)。初期はQwenに設定されている、無料試すModelが多くて、検証にベスト。

リアル検索:trivyを使い、会話中自動呼び出す。天気、株、その他リアル情報

  1. 普通のChatbot機能
  2. リアルタイム会話(各言語、また中国地方方言対応、上海、四川、粤语、天津など)
  3. 短い会話(会話⇒回答繰り返し)同時にテキスト出力も、翻訳、音声ファイル生成など
  4. 画像生成(テキスト⇒画像、画像合成(テキスト、複数画像⇒画像)
  5. 画像識別(テキスト抽出、画像のものを判別など)
  6. 生成されたものが自動保存し、画像、音声ファイルを自分のGalleryに保存、参照可能
  7. 携帯、PC対応、多言語対応