MENU

生成AIに強みを持つベトナムオフショア開発 | 株式会社スクーティーブログ

大規模言語モデル– tag –

生成AI

OpenAIが GPT-OSS をリリース！120B超大型オープンソース推論モデルの実力

OpenAI初のオープンソース推論モデル GPT-OSS (120B/21B) を完全解説。MoEアーキテクチャとharmony response formatによる透明な推論過程、MMLU 90.0%の高性能、Apache 2.0ライセンスでの商用利用可能性を詳細分析。実装方法から競合比較まで網羅した技術ガイド。

August 12, 2025
生成AI

AIが変えるソフトウェア開発の未来：Karpathy氏が語る新時代

AI、特にLLMがソフトウェア開発を根本から変革。Andrej Karpathy氏が語る新時代では、Software 3.0（プロンプトによるLLM操作）が主流に。エンジニアはLLMの特性を理解し、人間とAIが協調する「部分的な自律性アプリ」開発やエージェント向けインフラ整備に大きな機会を見出せる。

June 21, 2025
生成AI

Anthropic Economic Index 最新分析：Claude 3.7 Sonnetが示すAI利用動向と経済への影響

Anthropic Economic Index は、Claudeの実利用データに基づきAIの経済影響を分析する指標。最新分析ではClaude 3.7 Sonnet導入後、コーディング等の利用が増加。拡張思考モードは技術・創造タスクで、AI利用全体では拡張(57%)が自動化(43%)を上回り、学習目的の利用が増えている。データ公開で研究も促進。

April 1, 2025
生成AI

Gemini 2.5 Pro Experimental 登場！ベンチマークNo.1、100万トークンの破壊力健在！

最新AI「 Gemini 2.5 Pro Experimental 」は思考するモデル。ベンチマークNo.1の実力で、特に推論・コーディング能力が向上。100万トークンの長文脈、マルチモーダル対応で、複雑なタスクや大規模データ処理が可能に。高度なアプリ開発もワンショットで実現する性能をGoogle AI Studioで体験できます。

March 31, 2025
生成AI

Mastra とは？AI開発を加速するTSフレームワーク

Mastra はTypeScript製のAI開発フレームワークです。エージェント、ワークフロー、RAGなどの機能で開発を効率化。OpenAI、Anthropic等と連携可能で、型安全かつシンプルなAPI、ローカル開発環境を提供し、迅速な開発を実現します。

March 25, 2025
生成AI

Mercury とは？dLLMが実現する爆速LLMを徹底解説

Mercury は、従来のLLMを凌駕する速度と品質を実現する、拡散モデルベースの新しい文章生成AIです。Inception Labsが開発したこの技術は、最大10倍の高速化を達成し、コード生成などのタスクで高い評価を得ています。連続的な言語空間の利用や生成途中での推論・修正機能により、生涯学習やパーソナライズも可能。AIの未来を大きく変える可能性を秘めた、注目の技術です。

March 5, 2025
生成AI

「AI Engineer Summit 2025」の動画がすごすぎる！ AIエージェントの最前線のポイントをお届け

AIエージェントは2025年に飛躍的な進化を遂げ、多様な業界で活用が加速。本記事では、AI Engineer Summit 2025での主要な講演内容を詳細に解説。エージェントの定義、開発課題、金融・研究・開発など各分野での応用事例、そして未来展望まで網羅し、AIエージェントの最前線と可能性を徹底解剖します。

March 1, 2025
生成AI

Claude 3.7 Sonnet : プログラミング能力最強モデル

Claude 3.7 Sonnet は、Anthropic社が開発した最新AIモデルです。従来のモデルを凌駕する高度な推論能力、思考プロセスの可視化、そして、特にコーディング支援に強みを持ちます。拡張思考モードにより複雑な問題解決が可能で、開発者の生産性向上に貢献。安全性と信頼性も重視した設計となっています。

February 26, 2025
業務効率化

Dify 企業導入成功事例：多業界での業務効率化と顧客体験改善

この事例記事は、Dify.AIの導入が各業界において業務効率化と顧客体験改善を実現した具体例を詳細に解説。医療、金融、Eコマース等多様な分野での成功体験、開発時間短縮や信頼性向上、企業規模やユースケース別の最適な導入戦略を豊富なデータと図表を用いて説明し、効果的な導入の成功要因についても解説している。

February 24, 2025
生成AI

GRPO とは？ : DeepSeek-R1で採用された16GBで10億パラメータモデルをファインチューニングする技術

GRPO (Group Relative Policy Optimization) は、従来の強化学習手法PPOを改良し、価値モデルを不要にすることで計算効率を大幅に向上させた新しいアルゴリズムです。DeepSeek-R1で採用され、16GBのVRAMでも10億パラメータモデルのファインチューニングを可能にしました。本記事では、GRPOの仕組み、PPOとの違い、そしてDeepSeek-R1での具体的な活用事例を詳細に解説します。

February 22, 2025
生成AI

効果的な AIエージェント設計方法：Anthropic公開の資料要約

2024年最新のAIエージェント設計ガイド。Anthropicの知見に基づき、エージェントとワークフローの違い、適切なフレームワークの選択、拡張LLMの構成要素、多様なワークフローパターン、自律エージェントの実装、ツール設計の重要性まで、具体的な事例とコード例を交えながら詳細に解説します。

February 15, 2025
生成AI

Gemini 2.0 全モデル完全解説: Flash, Lite, Proを比較

Googleの Gemini 2.0 シリーズは、Flash、Flash-Lite、Pro、Experimentalの4モデルで構成。各モデルは速度、コスト、性能が異なり、用途で選択。特にPro Experimentalは高度な推論やコーディングに強く、今後の発展に期待。

February 14, 2025
生成AI

OpenAI o3-mini の概要と性能比較：最新小型推論モデルの詳細

OpenAI o3-mini は低コスト・低遅延でありながら、従来のo1やo1-miniと同等以上の推論能力を発揮する最新小型モデルです。科学、数学、プログラミング分野で高精度な回答を実現し、low/medium/highの推論設定により柔軟に応答を制御でき、APIのコンテキストウィンドウや価格面でも優れた性能を提供します。

February 3, 2025
生成AI

DeepSeek Janus-Pro-7B : 画像生成・理解でAI新時代へ

DeepSeekが開発した「 DeepSeek Janus-Pro-7B 」は、画像生成と文章理解を単一モデルで実現する革新的なAIです。7BパラメータのLLMを基盤とし、最適化された学習戦略と大規模データセットにより、従来モデルを凌駕する性能を達成。特に、短いプロンプトからの高品質な画像生成、複雑な指示への対応、人間レベルの文章理解能力が強みです。本記事では、その仕組み、性能、活用例を詳細に解説します。

February 1, 2025
生成AI

DeepSeek 利用規約・プライバシーポリシー要約【2025年1月28日現在】

中国発オープンソースの大規模言語モデル（LLM）である DeepSeek が大きな話題を読んでいます。その理由は圧倒的な費用対効果です。しかし、安くて高機能だからと言って簡単に乗り換える判断を指定いいものでしょうか？本記事では、DeepSeekの利用規約、及びプライバシーポリシーの要点、注意点をまとめました。

January 28, 2025
生成AI

DeepSeek 創業者　梁文峰：異色のAI先駆者が語る挑戦

DeepSeekの創業者である梁文峰は、中国のトップクオンツファンド出身という異色の経歴を持ち、AGI（汎用人工知能）の実現を目標に掲げています。利益よりも技術革新を重視し、MLAやDeepSeekMoEといった独自のアーキテクチャを開発、オープンソース戦略を採用することで、AI業界に価格破壊をもたらしました。経験よりも情熱と創造性を重視する人材戦略で、若き才能を発掘し、長期的な視点で研究開発を進めています。DeepSeekは、技術革新の最前線に立ち、中国AI業界の変革を牽引する存在として、世界中から注目を集めています。梁文峰の飽くなき挑戦は、AI技術の民主化と、AGI実現という人類の夢を切り開く可能性を秘めています。

January 27, 2025
生成AI

DeepSeek-R1 ：最大6710億パラメータで推論能力を飛躍的に向上させたAI

DeepSeek-R1 は、6710億パラメータを持つ、最先端のオープンソース大規模言語モデルです。MITライセンスで公開され、商用利用も可能です。MoEアーキテクチャと強化学習により、数学、コード、推論タスクでGPT-4に匹敵する性能を達成。知識蒸留による小型化も実現し、多様なハードウェアで実行可能です。API経由での利用や、チャットウェブサイトでの試用も可能で、今後のLLM研究開発に大きく貢献すると期待されます。

January 24, 2025
生成AI

【AIがブラウザを操作】Browser Use の Web UI を使ってみる　〜結局あきらめたDockerでの構築の作業履歴を添えて〜

この記事では、早速 Browser Use WebUIをローカル環境に構築して使ってみたので、その結果をお伝えします。Dockerでの構築に苦戦した経緯と、最終的にローカル環境で構築するまでの手順を詳細に解説し、その過程で得られた知見を共有します。皆様、私の屍の上を越えていってくだされば幸いです。

January 16, 2025
生成AI

OpenAI o3/o3-mini: 人間を超える推論力と安全性を備えた最新AI

OpenAIの最新モデル「o3」と「o3-mini」は、人間を超える推論能力と安全性を備え、AIの新たな可能性を提示します。特に、o3は難関ベンチマークで人間超えのスコアを達成し、o3-miniは低コストで高効率な推論を実現しました。安全性評価においても、Deliberative Alignment技術により、従来のモデルを上回る性能を達成しています。この記事では、これらのモデルの性能、安全性、将来の展望について詳しく解説します。

December 22, 2024
生成AI

Gemini 2.0: Google最新AIの速報

Googleの最新AI「Gemini 2.0」は、テキスト、画像、音声を統合的に処理するマルチモーダルAIです。特に「Gemini 2.0 Flash」は、従来比2倍の処理速度と高い性能を実現。ネイティブツール利用やリアルタイムAPIにより、多様なアプリ開発を支援します。本記事では、開発者向け機能、活用事例、安全性、将来性を深掘りし、その可能性を解説します。

December 13, 2024

12