大規模言語モデル– tag –
-
生成AI
OpenAI o3-mini の概要と性能比較:最新小型推論モデルの詳細
OpenAI o3-mini は低コスト・低遅延でありながら、従来のo1やo1-miniと同等以上の推論能力を発揮する最新小型モデルです。科学、数学、プログラミング分野で高精度な回答を実現し、low/medium/highの推論設定により柔軟に応答を制御でき、APIのコンテキストウィンドウや価格面でも優れた性能を提供します。 -
生成AI
DeepSeek Janus-Pro-7B : 画像生成・理解でAI新時代へ
DeepSeekが開発した「 DeepSeek Janus-Pro-7B 」は、画像生成と文章理解を単一モデルで実現する革新的なAIです。7BパラメータのLLMを基盤とし、最適化された学習戦略と大規模データセットにより、従来モデルを凌駕する性能を達成。特に、短いプロンプトからの高品質な画像生成、複雑な指示への対応、人間レベルの文章理解能力が強みです。本記事では、その仕組み、性能、活用例を詳細に解説します。 -
生成AI
DeepSeek 利用規約・プライバシーポリシー 要約【2025年1月28日現在】
中国発オープンソースの大規模言語モデル(LLM)である DeepSeek が大きな話題を読んでいます。その理由は圧倒的な費用対効果です。しかし、安くて高機能だからと言って簡単に乗り換える判断を指定いいものでしょうか?本記事では、DeepSeekの利用規約、及びプライバシーポリシーの要点、注意点をまとめました。 -
生成AI
DeepSeek 創業者 梁文峰 : 異色のAI先駆者が語る挑戦
DeepSeekの創業者である 梁文峰 は、中国のトップクオンツファンド出身という異色の経歴を持ち、AGI(汎用人工知能)の実現を目標に掲げています。利益よりも技術革新を重視し、MLAやDeepSeekMoEといった独自のアーキテクチャを開発、オープンソース戦略を採用することで、AI業界に価格破壊をもたらしました。経験よりも情熱と創造性を重視する人材戦略で、若き才能を発掘し、長期的な視点で研究開発を進めています。DeepSeekは、技術革新の最前線に立ち、中国AI業界の変革を牽引する存在として、世界中から注目を集めています。梁文峰の飽くなき挑戦は、AI技術の民主化と、AGI実現という人類の夢を切り開く可能性を秘めています。 -
生成AI
DeepSeek-R1 : 最大6710億パラメータで推論能力を飛躍的に向上させたAI
DeepSeek-R1 は、6710億パラメータを持つ、最先端のオープンソース大規模言語モデルです。MITライセンスで公開され、商用利用も可能です。MoEアーキテクチャと強化学習により、数学、コード、推論タスクでGPT-4に匹敵する性能を達成。知識蒸留による小型化も実現し、多様なハードウェアで実行可能です。API経由での利用や、チャットウェブサイトでの試用も可能で、今後のLLM研究開発に大きく貢献すると期待されます。 -
生成AI
【AIがブラウザを操作】Browser Use の Web UI を使ってみる 〜結局あきらめたDockerでの構築の作業履歴を添えて〜
この記事では、早速 Browser Use WebUIをローカル環境に構築して使ってみたので、その結果をお伝えします。Dockerでの構築に苦戦した経緯と、最終的にローカル環境で構築するまでの手順を詳細に解説し、その過程で得られた知見を共有します。皆様、私の屍の上を越えていってくだされば幸いです。 -
生成AI
OpenAI o3/o3-mini: 人間を超える推論力と安全性を備えた最新AI
OpenAIの最新モデル「o3」と「o3-mini」は、人間を超える推論能力と安全性を備え、AIの新たな可能性を提示します。特に、o3は難関ベンチマークで人間超えのスコアを達成し、o3-miniは低コストで高効率な推論を実現しました。安全性評価においても、Deliberative Alignment技術により、従来のモデルを上回る性能を達成しています。この記事では、これらのモデルの性能、安全性、将来の展望について詳しく解説します。 -
生成AI
Gemini 2.0: Google最新AIの速報
Googleの最新AI「Gemini 2.0」は、テキスト、画像、音声を統合的に処理するマルチモーダルAIです。特に「Gemini 2.0 Flash」は、従来比2倍の処理速度と高い性能を実現。ネイティブツール利用やリアルタイムAPIにより、多様なアプリ開発を支援します。本記事では、開発者向け機能、活用事例、安全性、将来性を深掘りし、その可能性を解説します。 -
生成AI
GoogleがGemini-exp-1206を発表:200万トークンのコンテキストウィンドウとマルチモーダルAI
Gemini-exp-1206は、Google DeepMindが開発した実験的な大規模言語モデルです。200万トークンを超えるコンテキストウィンドウとマルチモーダル機能が特徴で、LMArenaベンチマークで高い性能を示しています。テキスト、画像、音声、動画を処理でき、ソフトウェア開発、コンテンツ作成、データ分析など様々な分野で活用が期待されています。Google AI Studioで無料で利用可能で、Gemini APIを通じてアプリケーションにも統合できます。 -
生成AI
Meta社がLlama 3.3を発表|Llama 3.1の405Bに匹敵する性能を70Bで実現!
Meta社が新たな大規模言語モデルLlama 3.3を発表しました。70Bパラメータでありながら、Llama 3.1の405Bモデルに匹敵する性能を実現し、大幅なコスト削減を達成。推論、数学、知識、指示追従、ツール使用など、幅広いタスクで性能向上しています。多言語にも対応し、チャットボット、アシスタント、コンテンツ生成など、様々な用途で効果を発揮。オープンソースとして公開され、AIコミュニティへの貢献も期待されます。 -
生成AI
Anthropic発表のComputer useを試してみた【生成AI x RPA!】
こんにちは、スクーティー代表のかけやと申します。弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご依頼を数多く頂いてい... -
生成AI
DifyのワークフローをDifyのエージェントから呼んでみる
DifyのワークフローをDifyのエージェントから呼んでみる、ということをやってみました。「え、なんのために・・・?」と思われるかもしれませんが、やってみたら結構便利そうだったので紹介します! -
生成AI
生成AIを活用して企業の生産性を最大化する方法
多くの企業がこの技術を活用し、業務プロセスの自動化やクリエイティブ分野での革新を実現していますが、正しい導入方法やリスクへの対応が欠かせません。 -
生成AI
DifyでOpenAIの最新モデルo1-previewとo1-miniを利用する方法
この記事では、Difyのv0.8.1アップデートで追加されたOpenAIの最新モデルo1-previewとo1-miniを使用する方法についてご紹介します。 -
生成AI
Llama 3.2 の概要:マルチモーダル/オンデバイス対応モデル
Llama 3.2は、テキスト生成、質問応答、翻訳、要約など、従来の言語モデルが得意としていたタスクに加え、画像の内容説明、画像からの情報抽出、画像に基づいた推論といった、視覚情報を扱うタスクにも対応できるようになりました。また、軽量モデルの提供により、従来はクラウド環境での実行が必須であったLLMを、より身近なデバイスで利用することが可能になり、AI技術の民主化を大きく前進させる可能性を秘めています。 -
生成AI
Contextual Retrievalとは:RAGの精度向上の手法
Contextual Retrievalは、従来のキーワードマッチングや意味検索に加えて、ユーザーのクエリやタスクの文脈を深く理解することで、より正確で適切な情報を提供します。特に、プログラミングや技術的な質問など、文脈理解が重要なタスクにおいて効果を発揮します。この記事では、Contextual Retrievalの概要をご紹介します。 -
生成AI
DifyでReflexionを試す:LLMの出力精度は上がるのか!?
Reflexionという手法が注目されています。LLMの出力の精度を上げる有効な手法のようです。 Reflexionは仕組みとしてはシンプルなので、Difyのワークフローで再現し、出力を検証してみました! -
生成AI
OpenAI o1-preview/mini:複雑な問題解決を加速する推論モデル
OpenAI社は、2024年9月12日、高度な推論能力を備えたAIモデルシリーズ「OpenAI o1」を発表しました。本記事では、OpenAI o1-preview/miniの技術的な詳細、従来モデルとの比較、ベンチマーク結果、ユースケース、そして安全性について、詳細に解説していきます。 これは、人間のように思考プロセスを用いて複雑な問題に取り組み、より洗練された、高精度なアウトプットを生成するAIモデルです。 -
生成AI
DifyでSELF-ROUTEを試す
SELF-ROUTEという手法が注目されています。RAGの精度を上げる有効な手法のようです。SELF-ROUTEは仕組みとしてはシンプルなので、Difyのワークフローで再現し、出力を検証してみました! -
生成AI
Difyの音声出力(TTS: Text‐to-Speech)を試す
Difyのバージョン0.6.14がリリースされました。このリリースではいくつかの新しい機能が追加されていますが、その中でも音声出力(TTS: Text-to-Speech)機能が追加されており、早く試そう試そうと思いつつ、やっと試すことができました! なのですが、、、あれれ?どうやって使うの・・・・・・?ということで結構はまったので(僕だけでしょうか??)、使い方をご紹介いたします!
12