単一APIを通じてLLMおよびマルチモーダルモデルへの高速アクセスを提供する統合AI推論プラットフォームで、サーバーレス、ファインチューニング、専用GPUなどの柔軟なデプロイオプションをサポートします。
フォローする
リポジトリを表示
動画を見る
コミュニティに参加
ブログ記事を読む