DeepSeek-R1
DeepSeek-R1
Editor's Choicelinkhttps://www.deepseek.com/
favorite

DeepSeek-R1は、数学、コード、推論タスクにおいてOpenAIのo1に匹敵するパフォーマンスを達成する高度なオープンソースAI推論モデルで、革新的な強化学習技術と広範なアクセスのための複数の蒸留版を特徴としています

banner
What is DeepSeek-R1
DeepSeek-R1は、DeepSeek AIによって開発された第一世代の推論モデルで、DeepSeek-R1-ZeroとDeepSeek-R1の2つの主要なバリアントがあります。671Bの総パラメータと37Bのアクティブパラメータを持つMixture-of-Experts (MoE)アーキテクチャに基づいており、AI推論能力における重要なブレークスルーを表しています。このモデルは、思考の連鎖プロセスを通じて複雑な推論タスクを処理するように設計されており、128Kトークンのコンテキスト長で機能します。DeepSeekのチャットプラットフォームを通じて、またはオープンソースモデルとして利用可能で、LlamaおよびQwenアーキテクチャに基づく1.5Bから70Bのパラメータを持つ複数の蒸留版があります。
Key Features of DeepSeek-R1
DeepSeek-R1は、数学、コード、および推論タスクにおいてOpenAIのo1モデルに匹敵する性能を達成する高度なオープンソースAI推論モデルです。大規模な強化学習を使用して訓練されており、段階的な推論、自己検証、反省機能を可能にする独自のアーキテクチャを特徴としています。このモデルは、LlamaおよびQwenに基づいて小型化されており、強力な性能を維持しながら、よりアクセスしやすくなっています。 高度な推論機能: 自己検証と反省パターンを用いた思考の連鎖推論を採用し、透明な段階的問題解決を可能にします 大規模RLトレーニング: 推論能力が監視された微調整なしで純粋に強化学習を通じて開発できることを検証する初のオープンリサーチです 柔軟なモデルオプション: 蒸留を通じて複数のサイズ(1.5Bから70Bパラメータ)で利用可能で、強力な性能を維持しながら異なる計算要件に対応するオプションを提供します 拡張されたコンテキスト長: 最大128Kトークンのコンテキスト長をサポートし、より長い入力を処理し、より詳細な応答を生成します
Use Cases
高度な数学問題解決: AIMEやMATH-500ベンチマークを含む複雑な数学問題を段階的な推論で解決するのに優れています ソフトウェア開発とコーディング: 高レベルのコーディングタスク、競技プログラミング問題、およびソフトウェア工学の課題を高い精度で実行します 教育支援: さまざまな科目にわたって詳細な説明と段階的な問題解決アプローチを提供することで、学生や教育者を支援します 多言語推論タスク: 英語と中国語の両方で複雑な推論タスクを処理し、国際的なアプリケーションにとって価値があります
Pros
MITライセンスの下でオープンソースで商業利用可能です OpenAIのo1のような専有モデルに匹敵する性能 異なる計算ニーズに対応するために複数のサイズで利用可能です
Cons
大きなモデルにはかなりの計算リソースが必要です 温度設定は繰り返しを防ぐために慎重に調整する必要があります システムプロンプトはサポートされていない - すべての指示はユーザープロンプト内にある必要があります
How to Use DeepSeek-R1
アクセス方法を選択: DeepSeek-R1にアクセスするための3つのオプションがあります: ウェブインターフェース、API、またはローカルインストール ウェブインターフェースアクセス: chat.deepseek.comにアクセスし、ログインして、DeepSeek-R1と対話するために'DeepThink'ボタンを有効にします。注意: 高度なモードでは1日50メッセージに制限されています APIアクセス: 1. platform.deepseek.comでサインアップしてAPIキーを取得します 2. model='deepseek-reasoner'を指定してOpenAI互換APIを使用します 3. base_urlをhttps://api.deepseek.com/v1に設定します ローカルインストール(蒸留モデル): vLLMまたはSGLangをインストールして、ローカルで小さな蒸留版を実行します。vLLMを使用する場合は、'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'を使用します 使用設定を構成: 温度を0.5-0.7の範囲に設定(0.6を推奨)、システムプロンプトを避け、ユーザープロンプトに指示を含め、数学の問題には'\boxed{}'ディレクティブを追加します モデルバージョンを選択: 計算リソースに基づいて、DeepSeek-R1-Zero(純粋なRLモデル)、DeepSeek-R1(フルモデル)、または蒸留版(Qwen/Llamaベース)を選択します プロンプトをフォーマット: システムプロンプトなしで、ユーザープロンプトにすべての指示を含めます。数学の問題については、最終的な回答を\boxed{}内で要求します 複数の応答を生成: 最良の結果を得るために、複数の応答を生成し、モデルのパフォーマンスを評価する際に結果を平均化します
DeepSeek-R1 FAQs
1.DeepSeek-R1とは何ですか?
DeepSeek-R1は、DeepSeek-AIによって開発された第一世代の推論モデルで、数学、コード、推論タスクにおいてOpenAI-o1に匹敵するパフォーマンスを達成します。大規模な強化学習を使用して訓練されており、DeepSeek-R1-ZeroとDeepSeek-R1の2つのバージョンがあります。
2.DeepSeek-R1のモデル仕様は何ですか?
DeepSeek-R1は、671Bの総パラメータを持ち、37Bのアクティブパラメータを持っています。MoE(Mixture of Experts)アーキテクチャを使用し、コンテキストの長さは128Kトークンです。
3.DeepSeek-R1はオープンソースですか?ライセンスは何ですか?
はい、DeepSeek-R1は完全にオープンソースで、MITライセンスの下でライセンスされています。商業利用をサポートし、他のLLMの訓練のための蒸留を含む、任意の変更や派生作品を許可しています。
4.DeepSeek-R1をどのように使用できますか?
DeepSeek-R1は、次の複数のチャネルを通じて使用できます:1)公式ウェブサイトchat.deepseek.comでチャットする 2)platform.deepseek.comでOpenAI互換APIを使用する 3)DeepSeek-V3リポジトリの指示に従ってローカルで実行する。
5.DeepSeek-R1を使用するための推奨設定は何ですか?
推奨設定には次が含まれます:1)温度を0.5-0.7(0.6推奨)に設定する 2)システムプロンプトを避け、ユーザープロンプトにすべての指示を含める 3)数学の問題については、'\boxed{}'ディレクティブを含める 4)パフォーマンスを評価する際に複数のテストを実施する。
6.DeepSeek-R1のユニークな点は何ですか?
DeepSeek-R1は、LLMの推論能力が監視されたファインチューニングなしで強化学習を通じて純粋にインセンティブを与えることができることを検証した最初のオープンリサーチとして注目されています。自己検証、反省、長い思考の連鎖を生成する能力を示しています。
Comment
I want to comment
message
DeepSeek-R1

DeepSeek-R1Editor's Choice

DeepSeek-R1 is an advanced open-source AI reasoning model that achieves performance comparable to OpenAI's o1 across math, code, and reasoning tasks, featuring innovative reinforcement learning techniques and multiple distilled versions for wider accessibility.

favorite
DeepSeek-R1
Free
#Large Language Models (LLMs)#Research Tools
Meta AI

Meta AIEditor's Choice

Meta AI is an advanced artificial intelligence assistant developed by Meta that can engage in conversations, answer questions, generate images, and perform various tasks across Meta's platforms.

favorite
Meta AI
Free
#Large Language Models (LLMs)#Multi-purpose Tools
Gemini - Google Vids AI

Gemini - Google Vids AIEditor's Choice

Gemini is Google's most advanced and capable multimodal AI model family that can seamlessly understand and reason across text, images, video, audio, and code to power various AI applications and services.

favorite
Gemini - Google Vids AI
Free Trial
#Large Language Models (LLMs)#AI Chatbot
Claude AI

Claude AIEditor's Choice

Claude AI is a next-generation AI assistant built for work and trained to be safe, accurate, and secure.

favorite
Claude AI
Free
#Large Language Models (LLMs)#AI Chatbot
ChatGPT

ChatGPTEditor's Choice

ChatGPT is an advanced AI-powered chatbot developed by OpenAI that uses natural language processing to engage in human-like conversations and assist with a wide range of tasks.

favorite
ChatGPT
Free
#Large Language Models (LLMs)#AI Chatbot
Kimi Chat

Kimi ChatEditor's Choice

Kimi Chat is an AI assistant developed by Moonshot AI that supports ultra-long context processing of up to 2 million Chinese characters, web browsing capabilities, and multi-platform synchronization.

favorite
Kimi Chat
Free Trial
#Large Language Models (LLMs)#AI Chatbot
muku.ai

muku.ai

MukuAI is an AI-powered platform that transforms ideas into viral-ready videos for social media with customizable styles, AI narration, and AI presenters.

favorite
muku.ai
Free Trial
#Large Language Models (LLMs)#Writing Assistants#AI Social Media Assistant#AI Video Generator#Text to Video#AI Tiktok Assistant#AI Repurpose Assistant#AI Response Generator
Molmo AI

Molmo AI

Molmo AI is an open-source, multimodal AI model developed by the Allen Institute for AI that can understand and interact with both images and text, rivaling proprietary models in performance.

favorite
Molmo AI
Free
#Large Language Models (LLMs)#AI Photo & Image Generator#AI Image Recognition
Gemini 2.0 Flash Thinking

Gemini 2.0 Flash ThinkingEditor's Choice

Gemini 2.0 is Google DeepMind's most capable AI model yet, featuring enhanced multimodal capabilities including native image generation, speech output, and autonomous agent abilities designed for the agentic era.

favorite
Gemini 2.0 Flash Thinking
Free
#Large Language Models (LLMs)#AI Chatbot#AI Code Assistant
Abacus.AI

Abacus.AI

Abacus.AI is the world's first AI-assisted end-to-end data science and MLOps platform that enables organizations to build and deploy custom AI systems and agents using state-of-the-art LLMs and machine learning capabilities.

favorite
Abacus.AI
Free Trial
#Large Language Models (LLMs)#AI Chatbot#AI Customer Service Assistant
TXYZ.AI

TXYZ.AI

TXYZ.AI is an AI-powered research assistant that revolutionizes the knowledge work pipeline by enhancing reading, searching, and writing capabilities for academic and professional use.

favorite
TXYZ.AI
Free
#Papers Writing#Research Tools
MacroMicro

MacroMicro

MacroMicro is a comprehensive macro analytics platform that combines technology and research expertise to empower investors with data-driven insights into global market trends.

favorite
MacroMicro
Free
#AI Investing & Trading Tools#Research Tools
OpenAI o1 in the API

OpenAI o1 in the APIEditor's Choice

OpenAI o1 is a new series of 'reasoning' models accessible through the API that excels at complex problem-solving tasks with enhanced reasoning capabilities, available in two variants: o1-preview and o1-mini.

favorite
OpenAI o1 in the API
Free
#Large Language Models (LLMs)#AI Code Assistant
SearchGPT

SearchGPTEditor's Choice

SearchGPT is an AI-powered search prototype by OpenAI that provides fast, conversational answers with clear sources using GPT models.

favorite
SearchGPT
Free Trial
#AI Search Engine#Large Language Models (LLMs)
AutoPosts AI

AutoPosts AI

AutoPosts AI is an AI-powered platform that automates the creation of engaging short-form videos for social media platforms like TikTok, YouTube, and Instagram.

favorite
AutoPosts AI
Free Trial
#Large Language Models (LLMs)#Writing Assistants#AI Script Writing#AI Speech Synthesis#AI Video Generator#Text to Speech#Text to Video#Anime & Cartoon Generator
ChatGLM

ChatGLM

ChatGLM is an open-source bilingual (Chinese-English) large language model series developed by Zhipu AI and Tsinghua KEG, featuring smooth dialogue capabilities and low deployment thresholds.

favorite
ChatGLM
Free
#Large Language Models (LLMs)#AI Chatbot
Imarena.AI

Imarena.AI

LMArena.ai is an open benchmarking platform for evaluating and comparing large language models (LLMs) through anonymous, randomized battles and crowdsourced voting.

favorite
Imarena.AI
Free
#Large Language Models (LLMs)#AI Chatbot#AI Tools Directory
Yeschat

Yeschat

YesChat is a comprehensive AI platform that integrates multiple advanced AI technologies including GPT-4o, DALL-E 3, and Claude 2, offering free access to 200,000+ specialized AI models for text generation, image creation, and intelligent conversations.

favorite
Yeschat
Free
#Large Language Models (LLMs)#Multi-purpose Tools
Chai

Chai

Chai is a leading AI platform for creating, sharing, and exploring chatbots powered by large language models.

favorite
Chai
Free
#Large Language Models (LLMs)#AI Chatbot
PizzaGPT - ChatGPT for Italy

PizzaGPT - ChatGPT for Italy

PizzaGPT is a free, open alternative to ChatGPT for Italian users, offering similar AI-powered conversational capabilities while addressing privacy concerns.

favorite
PizzaGPT - ChatGPT for Italy
Free
#Large Language Models (LLMs)#AI Chatbot