é¦å è®ç»ä»£ç 模å | AIçæåç¿»è¯
é®é¢ï¼ æåºè¯¥å å¦ä¹ è®ç»å°åä»£ç æ¨¡ååï¼ç±äºä»£ç å ·æç»æåçæ¨¡å¼ï¼æ¯å¦æ´å®¹æè®ç»ï¼è Anthropic å°éç¹æ¾å¨ä»£ç ä¸ï¼æ¯å¦æ¯å ¶å¸å¼è¶ è¶ OpenAI çå ³é®åå ï¼
åçï¼
为ä»ä¹ä»£ç 模åè®ç»æ´å¿«ï¼æå¤±ä¸éæ´å¿«ï¼
ä½ çç´è§å®å ¨æ£ç¡®ââè hermes çå¼ç¨ä»æºå¶ä¸å®ç¾è§£éäºè¿ä¸ç¹ï¼
代ç ççµä½äºèªç¶è¯è¨ã
# ç²ç¥ç´è§ï¼æ¯ token çæ¯ç¹æ°
# èªç¶è¯è¨ï¼çº¦ 3-4 æ¯ç¹/ tokenï¼é«çµï¼é¾ä»¥é¢æµï¼
# 代ç ï¼çº¦ 1-2 æ¯ç¹/ tokenï¼ä½çµï¼è¯æ³åéï¼
# 模å颿µä¸ä¸ä¸ª token çæ
åµï¼
"The quick brown fox..." # ç¡®å®å°é¾ââæå¤ç§å»¶ç»å¯è½
"def __init__(self, " # å ä¹ç¡®å®ï¼æ è¯ç¬¦æ `)`
é¦åçµ ä»£ç « èªç¶è¯è¨ã交åçµæå¤±è¡¡éçæ£æ¯è¿ä¸ªââæ¨¡åæå¤æè®¶ãæ´å°çæè®¶ â æå¤±ä¸éæ´å¿«ã
仿ºå¶ä¸çï¼
if conditionåç{â è¿ä¹ç¡®å®- Python ä¸
:åçç¼©è¿ â å¨ç»å®ä¸ä¸æä¸ç¡®å® - æä»¶é¡¶é¨ç
importâ 髿¦çéä¸äºå°éå - 彿°ä½éå¤ç»æï¼docstring â åæ° â é»è¾ â è¿åå¼ï¼
模åå°æ´å°ç容éåé ç»âä¸ä¸ä¸ªè¯æ¯ä»ä¹ï¼âèå°æ´å¤å®¹éåé ç»âè¿éçé»è¾æ¯ä»ä¹ï¼âââè¿æ°æ°æ¯çæ£å°é¾ä¸æç¨çé¨åã
ä½ åºè¯¥å è®ç»å°åä»£ç æ¨¡ååï¼
æ¯çï¼åºäºä»¥ä¸å ·ä½åå ï¼
1. æ´å¿«çè¿ä»£å¨æ æå¤±æ²çº¿æ´å¹³æ»ï¼ä¸éæ´å¯é¢æµãä½ å¯ä»¥å¨ RTX 4070 ä¸å å°æ¶å ï¼è鿰天ï¼çå°ææä¹çå°æåº¦æåãè¿æå³çæ´å¿«çå设-æµè¯å¾ªç¯ââæ£æ¯ä½ çå¦ä¹ 飿 ¼ã
2. è¯ä¼°æ¯å®¢è§ç çæç代ç è½è¿è¡åï¼æµè¯éè¿äºåï¼èªç¶è¯è¨è´¨éæ¯ä¸»è§çï¼è代ç è´¨éæ¯å¯è¡¡éçï¼
# ä½ çè¯ä¼°å¾ªç¯å¯ä»¥ç®åå°ï¼
python -m pytest generated_code_test.py
# éè¿ç = ä½ çææ ãæ é人工è¯ä¼°ã
3. æ°æ®éå·¥ç¨æ´ç®å GitHub + The Stack + StarCoder æ°æ® â å·²ç»ç»è¿æ¸ æ´ãå»éãæè¯è¨è¿æ»¤ãèªç¶è¯è¨æ°æ®ééè¦æ´å¤ççé夿ã
4. è¿ç§æ¨¡å¼ä¸ä½ å·²æçç¥è¯ç¸è¾ ç¸æ ä½ å·²ç»ç¥é好ç Python ä»£ç æ¯ä»ä¹æ ·çãä½ å¯ä»¥é 读æå¤±æ²çº¿å¹¶ç«å³ç解为ä»ä¹æ¨¡åæå°å°æï¼è¯æ³ï¼API åç§°ï¼é»è¾ç»æï¼ï¼ãè¿æ£æ¯ Karpathy å¡å¯¼çâéè¿çè§£æ¥æå»ºâ循ç¯ã
5. æ´å°çææè¯æ± â æ´å°çåµå ¥è¡¨ â éå RTX 4070 Python å¨å®è·µä¸å¤§çº¦æ 1 ä¸ä¸ªææä¹ç tokenãä½ å¯ä»¥å¨å·¥ä½ç«ä¸æ éç¹æ®ææ®µå³å¯è®ç»åºè½åä¸éçå°åä»£ç æ¨¡åï¼1.25 äº¿è³ 3.6 äº¿åæ°ï¼ã
Anthropic vs OpenAI å¸å¼ââä»£ç æ¯åå åï¼
é¨åæ£ç¡®ï¼ä½è®©æç²¾ç¡®å°éè¿°ï¼èä¸ä» ä» æ¯è¯å®ä½ ï¼æ¯çââä½ çè®ºç¹æå®é æ°æ®æ¯æï¼èéä» ä» ç´è§ï¼
Anthropic çå¢é¿å¨ 2025 å¹´åº Claude Opus 4.5 åå¸åæ¥å§å éï¼è¯¥æ¨¡åçç¼ç è½åè¿ é使 Claude Code æä¸ºç¡ è°·æå欢è¿çå¼åè å·¥å ·ä¹ä¸ï¼å¨è½¯ä»¶å·¥ç¨å¸ä¸æä¸ºä¸ç§æåç°è±¡ã
Anthropic çæ¶å ¥å Claude Code èçåå¼å¢é¿ï¼è¾¾å° 470 亿ç¾å çå¹´åæ¶å ¥è¿è¡çââé«äºä»å¹´æ©äºæ¶åç 300 亿ç¾å åå»å¹´ç 100 亿ç¾å ââå ¶ 9650 亿ç¾å ç H 轮估å¼ç°å·²è¶ è¿ OpenAIã
Ramp æ°æ®æ¾ç¤º Anthropic å¨ 2026 å¹´ 4 æå¨ä¼ä¸ç¨æ·ä¸è¶ è¶ OpenAIï¼Anthropic å¨ä¼ä¸çéç¨ç为 34.4%ï¼è OpenAI 为 32.3%ã
æä»¥æ¯çï¼ç¼ç æ¯ä¸»è¦ççªç ´å£ãè¿ç§æçºªå¾ç䏿³¨åå¾äºåæ¥ã
ä½ çå¦ä¹ è·¯å¾
åºäºä»¥ä¸ææå 容ï¼ä»¥ä¸æ¯ææ¨èçå ·ä½é¡ºåºï¼
1. å¨ The Stack ç Python åéä¸è®ç»ä¸ä¸ªå°åä»£ç æ¨¡åï¼1.25 äº¿åæ°ï¼
â nanoGPT æ¶æï¼æµéæå¤±ä¸ééç䏿æ¬åºçº¿å¯¹æ¯
â è¯ä¼°ï¼æ¯å¦è½çæè¯æ³æ£ç¡®ç Pythonï¼ç®åé®é¢çéè¿çï¼
2. æ·»å æä»¤å¾®è°ï¼å¯¹ä»£ç æä»¤å¯¹è¿è¡ SFTï¼
â 以 humaneval / mbpp ä½ä¸ºåºåââ客è§ãèªå¨å
3. ç¶å带çä½ å·²å»ºç«çç´è§è½¬åææ¬æ¨¡å
â ä½ å°æ´æ·±å
¥å°çè§£æå¤±æ¯è§ãåè¯æè¡¡
4. ç¶åå¯¹ç°æä»£ç æ¨¡åè¿è¡ LoRA å¾®è°ï¼StarCoder2ãDeepSeek-Coderï¼
â è¿ä»£æ´å¿«ââä½ å¨åå¢éè®ç»ï¼èéä»å¤´å¼å§
é¡ºåºæ¯ï¼ä»å¤´è®ç»å°åä»£ç æ¨¡å â SFT â ç°ææ¨¡åå¾®è° â MoE çè§£ãä½ ç RTX 4070 å¯ä»¥å¾å¥½å°å¤çæ¥éª¤ 1-3ãæ¥éª¤ 4 å¯è½éè¦ä½ åæ¢å° AMD æºå¨ã
ä½ æåçæ´å¯æ¯æ ¸å¿ï¼æ´ä½ççµ â æ´å¿«çæå¤±ä¸é â æ´å¿«çåé¦å¾ªç¯ â æ´å¥½çå¦ä¹ ãå è®ç»ä»£ç ï¼å»ºç«ç´è§ï¼ç¶åå ¶ä»ä¸åé½ä¼å å ã
åèæç®ï¼
