LLM– tag –
-
生成AI
OpenAI o3/o3-mini: 人間を超える推論力と安全性を備えた最新AI
OpenAIの最新モデル「o3」と「o3-mini」は、人間を超える推論能力と安全性を備え、AIの新たな可能性を提示します。特に、o3は難関ベンチマークで人間超えのスコアを達成し、o3-miniは低コストで高効率な推論を実現しました。安全性評価においても、Deliberative Alignment技術により、従来のモデルを上回る性能を達成しています。この記事では、これらのモデルの性能、安全性、将来の展望について詳しく解説します。 -
生成AI
LCMs(Large Concept Models)とは: Metaが提唱する200言語対応の次世代言語モデル
Metaが提唱するLCMsは、概念レベルで言語を処理する革新的モデルです。トークンベースの従来LLMとは異なり、文を単位として扱い、SONAR埋め込み空間で推論します。200言語対応、ゼロショット汎化、マルチモーダル対応が特徴で、長い文脈の理解や多様なテキスト生成タスクで高い性能を発揮します。 -
生成AI
Gemini 2.0: Google最新AIの速報
Googleの最新AI「Gemini 2.0」は、テキスト、画像、音声を統合的に処理するマルチモーダルAIです。特に「Gemini 2.0 Flash」は、従来比2倍の処理速度と高い性能を実現。ネイティブツール利用やリアルタイムAPIにより、多様なアプリ開発を支援します。本記事では、開発者向け機能、活用事例、安全性、将来性を深掘りし、その可能性を解説します。 -
生成AI
Bolt.newの導入と活用術:ノーコストで始めるAI開発
AI開発に興味があるけれど、高額なクラウドサービスや複雑な設定に悩んでいませんか?そんな方に最適なのが『Bolt.new』。このツールを使えば、ローカル環境でAIアプリを簡単に開発できるうえ、クラウド依存のコストや制限を回避できます。本記事では、Bolt.newの基本的な使い方からローカルLLMの統合まで、効率的なAIアプリ開発を実現する方法を詳しく解説します。初心者からプロまで役立つ情報が満載です。 -
生成AI
GoogleがGemini-exp-1206を発表:200万トークンのコンテキストウィンドウとマルチモーダルAI
Gemini-exp-1206は、Google DeepMindが開発した実験的な大規模言語モデルです。200万トークンを超えるコンテキストウィンドウとマルチモーダル機能が特徴で、LMArenaベンチマークで高い性能を示しています。テキスト、画像、音声、動画を処理でき、ソフトウェア開発、コンテンツ作成、データ分析など様々な分野で活用が期待されています。Google AI Studioで無料で利用可能で、Gemini APIを通じてアプリケーションにも統合できます。 -
生成AI
Meta社がLlama 3.3を発表|Llama 3.1の405Bに匹敵する性能を70Bで実現!
Meta社が新たな大規模言語モデルLlama 3.3を発表しました。70Bパラメータでありながら、Llama 3.1の405Bモデルに匹敵する性能を実現し、大幅なコスト削減を達成。推論、数学、知識、指示追従、ツール使用など、幅広いタスクで性能向上しています。多言語にも対応し、チャットボット、アシスタント、コンテンツ生成など、様々な用途で効果を発揮。オープンソースとして公開され、AIコミュニティへの貢献も期待されます。 -
生成AI
OpenAIが最新推論モデルのo1とo1 pro modeをリリース!
OpenAIが最新推論モデルo1と、上位版のo1 pro modeをリリース。高度な推論能力とマルチモーダル機能、思考プロセス改善による速度と精度の向上、安全性と制御性の強化を実現し、各種ベンチマークで優れた性能を示しました。ChatGPT Proユーザーはo1を無制限に利用でき、o1 pro modeではより複雑な問題にも対応可能です。 -
生成AI
Claude MCPでAIエージェントはさらなる未来へ・・・Anthropic社発表のAIとWebサービス統合標準規格
多くの Claude ユーザーが同じ悩みを抱えています。Claude 3.5 は非常に優秀な AI アシスタントですが、外部データとの連携が限られている点が課題でした。しかし、Anthropic 社が発表した「Model Context Protocol(MCP)」という画期的な「規格」により、この状況は大きく変わりつつあります。この記事では、MCP の概要、具体的な使用例、導入方法まで、分かりやすく解説します。 -
生成AI
Gemini-exp-1114:ベンチマークでGPT-4o超え?詳細と評価、使い方を徹底解説
Gemini-exp-1114 が登場し、LLM 界隈が賑わっています。Chatbot Arena のベンチマークで一位を獲得し、GPT-4o を超えたという報告に、期待が高まっている方も多いのではないでしょうか。この記事では、Gemini-exp-1114 の詳細な評価、ベンチマーク結果、そして具体的な使用方法まで、専門家向けに徹底的に解説します。 -
生成AI
Anthropic発表のComputer useを試してみた【生成AI x RPA!】
こんにちは、スクーティー代表のかけやと申します。弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご依頼を数多く頂いてい... -
生成AI
DifyのワークフローをDifyのエージェントから呼んでみる
DifyのワークフローをDifyのエージェントから呼んでみる、ということをやってみました。「え、なんのために・・・?」と思われるかもしれませんが、やってみたら結構便利そうだったので紹介します! -
生成AI
OpenAIの「Swarm」を試してみた:軽量マルチエージェント・オーケストレーション・フレームワーク
OpenAI が発表した Swarm は、複数のAIエージェントを協調させて複雑なタスクを実行するための、軽量で人間工学に基づいた実験的なフレームワークです。 本記事では、Swarmの特徴や仕組み、そしてGoogle Colabで動作する簡単なサンプルをご紹介しようと思います。 -
生成AI
Difyの外部知識ベースAPIを使用してみる
Difyの外部知識ベースAPIは、Difyプラットフォーム外部に存在する知識ベースをDifyのAIアプリケーションと統合するための強力な機能です。このAPIを利用することで、開発者は独自の検索アルゴリズムや外部の知識ベースサービスを活用し、AIアプリケーションの機能を拡張できます。 本記事では、Difyの外部知識ベースAPIの仕様、用途、実装方法、設定方法、そして注意点について詳細に解説します。 -
生成AI
生成AIを活用して企業の生産性を最大化する方法
多くの企業がこの技術を活用し、業務プロセスの自動化やクリエイティブ分野での革新を実現していますが、正しい導入方法やリスクへの対応が欠かせません。 -
生成AI
DifyでOpenAIの最新モデルo1-previewとo1-miniを利用する方法
この記事では、Difyのv0.8.1アップデートで追加されたOpenAIの最新モデルo1-previewとo1-miniを使用する方法についてご紹介します。 -
生成AI
Llama 3.2 の概要:マルチモーダル/オンデバイス対応モデル
Llama 3.2は、テキスト生成、質問応答、翻訳、要約など、従来の言語モデルが得意としていたタスクに加え、画像の内容説明、画像からの情報抽出、画像に基づいた推論といった、視覚情報を扱うタスクにも対応できるようになりました。また、軽量モデルの提供により、従来はクラウド環境での実行が必須であったLLMを、より身近なデバイスで利用することが可能になり、AI技術の民主化を大きく前進させる可能性を秘めています。 -
生成AI
Contextual Retrievalとは:RAGの精度向上の手法
Contextual Retrievalは、従来のキーワードマッチングや意味検索に加えて、ユーザーのクエリやタスクの文脈を深く理解することで、より正確で適切な情報を提供します。特に、プログラミングや技術的な質問など、文脈理解が重要なタスクにおいて効果を発揮します。この記事では、Contextual Retrievalの概要をご紹介します。 -
生成AI
DifyでReflexionを試す:LLMの出力精度は上がるのか!?
Reflexionという手法が注目されています。LLMの出力の精度を上げる有効な手法のようです。 Reflexionは仕組みとしてはシンプルなので、Difyのワークフローで再現し、出力を検証してみました! -
生成AI
OpenAI o1-preview/mini:複雑な問題解決を加速する推論モデル
OpenAI社は、2024年9月12日、高度な推論能力を備えたAIモデルシリーズ「OpenAI o1」を発表しました。本記事では、OpenAI o1-preview/miniの技術的な詳細、従来モデルとの比較、ベンチマーク結果、ユースケース、そして安全性について、詳細に解説していきます。 これは、人間のように思考プロセスを用いて複雑な問題に取り組み、より洗練された、高精度なアウトプットを生成するAIモデルです。 -
生成AI
DifyでSELF-ROUTEを試す
SELF-ROUTEという手法が注目されています。RAGの精度を上げる有効な手法のようです。SELF-ROUTEは仕組みとしてはシンプルなので、Difyのワークフローで再現し、出力を検証してみました!
12