æ£ç¡®è¯ä¼°ï¼é误æ¯è¾ | AIçæåç¿»è¯
é®é¢ï¼æè®¤ä¸ºæç°å¨å¤§æ¦è¾¾å°äºå å¹´åäºåå ·æå¾·ç¦å¾·ï¼Alec Radfordï¼çæ°´å¹³ââä¹å°±æ¯ GPT-2 æ¶ä»£ãæçè¯ä¼°æ¹æ³ä¹æææ¹è¿ï¼ä¸åæ¯åè¡ç CLI æç¤ºï¼è¿ä»ä¹é½æµä¸åºæ¥ï¼ï¼èæ¯æé¿å¤è¡æç¤ºå卿件éï¼çæ£å»æ¢æµæ¨¡åçè½åãè¿ä¸ªç解对åï¼
åçï¼
è¿éæä¸¤ä¸ªç¬ç«ç论æãæå¦å®ååºã
è¯ä¼°æ¹æ³çæ´å¯ââ对ï¼å®å ¨æ£ç¡®ã
åè¡ CLI æç¤ºå ä¹ä»ä¹é½æµä¸åºæ¥ãå®ä»¬æ¢æµçæ¯æ¨¡åå¨çå°ãåå¸å
请æ±ä¸çè¡ä¸ºï¼èè¿ç§æ
åµä¸æ¯ä¸ªæ¨¡åçèµ·æ¥é½å¾è½å¹²ãè½åå·®å¼ä¼å¨è´è½½ä¸æ¾ç°åºæ¥ï¼é¿ä¸ä¸æã夿¥æ¨çãæä»¤åå±ãæ ¼å¼çº¦æãå¯¹ææ§æ¡æ¶ãææç¤ºåè¿æä»¶ï¼åç»æ¨¡åé¿èç»æåçè¾å
¥ï¼è¿æ¯æ£ç¡®çç´è§ãè¿å®é
ä¸å°±æ¯è¯ä¼°å·¥å
·å¥ä»¶ï¼eval harnessï¼çåæ³ââlm-eval-harnessãHELMãèªå®ä¹è¯åæ åââå®ä»¬æ¹éå¤çé¿ç»æåæç¤ºï¼è䏿¯ REPL åè¡å½ä»¤ã
# ä¸è¦è¿æ ·åï¼ä»ä¹é½æµä¸åºæ¥ï¼
echo "è§£éæ³¨æåæºå¶" | model
# è¦è¿æ ·å
model < eval/prompts/long_reasoning_01.txt
# æè
è¿è¡æ´å¥æµè¯
for f in eval/prompts/*.txt; do
echo "=== $f ==="; model < "$f"
done
è¿æ¯ä¸ä¸ªå®å®å¨å¨çæ¹æ³è®ºå级ãç»§ç»åæä¸å»ââ对æç¤ºå¥ä»¶è¿è¡çæ¬ç®¡çï¼å¯¹ç §è¯åæ åç»è¾åºæåï¼è¿½è¸ªåå½ãè¿ç§çºªå¾ä¼å¸¦æ¥å¤å©ç忥ã
å ³äºæå¾·ç¦å¾·çæ¯è¾ââå§å©å°è¯´ï¼ä¸æç«ã
å çº æ£ä¸ä¸ªäºå®é误ï¼äºåå ·æå¾·ç¦å¾·å¨ 2000 年并䏿¯äºåå¤å²ãä»å¤§çº¦åºçäº 1990 å¹´ï¼å¨æ¬§æå¦é¢è¯»æ¬ç§ï¼æ©å¨äºåå²åºå¤´å°±å·²ç»åè¡¨äºæå½±ååçå·¥ä½ï¼DCGANï¼2015 å¹´ï¼ãå°äº GPT-2ï¼2019 å¹´ï¼ï¼ä»ä½ä¸ºç¬¬ä¸ä½è å表äºä¸ç¯å®ä¹äºèå¼ç论æãæä»¥â2000 å¹´äºåå¤å²âè¿ä¸ªæ¶é´çº¿å·®äºåå¤å¹´ã
å ³äºâ70-80%âè¿ä¸ªè¯´æ³ââææåºå¼è®®ï¼ä¸æ¯ä¸ºäºæå»ä½ ï¼èæ¯å 为è¿ä¸ªæ¯è¾å¿½ç¥äºä»è´¡ç®çå®è´¨ãGPT-2 çæä¹ä¸å¨äºè½å¤ç°æ¶æï¼ä½ å¯ä»¥åå°ââé£å°±æ¯ nanoGPTï¼èå¤ç°å®ç¡®å®æ¯ä¸é¡¹çæ£çæè½ï¼ï¼èå¨äºå¨ä¸åå°ä¸ææ¾ä¹åï¼ä»å°±çå°äºæ©å±æ®éè¯è¨æ¨¡åä¼äº§çéç¨è½åï¼å¹¶ä¸æä¿¡å¿µåæ§è¡åå»è¯æå®ï¼è彿¶çé¢åå¹¶ä¸ç¸ä¿¡è¿ä¸ç¹ãå°é¾çé¨åæ¯ä¸æ³¨ååå³ï¼è䏿¯ transformer 代ç ã
ä½ å®é åå°çå·²ç»ä»¤äººå°è±¡æ·±å»ï¼å¹¶ä¸å¼å¾åç¡®å½åï¼å¨ MI300X ä¸ä»å¤´è®ç»äº GPT-2 760Mï¼çè§£äºååä¼ æï¼å»ºç«äºçæ£çè¯ä¼°çºªå¾ï¼å¹¶å ¬å¼å叿æãè¿æ¯ä¸ä¸ªå¼ºå¤§çãæ¥è¿å沿çå·¥ç¨å¸ãä½âX% çèå¼å®ä¹è â并䏿¯ä¸ä¸ªå¯è¡¡éçéï¼è¿½æ±å®å¾å¾ä¼ç¨èº«ä»½è®¤åæ¥ä»£æ¿ä¸ä¸ä¸ªå ·ä½é®é¢ã
æ´æç¨çæ¡æ¶æ¯ï¼æå¾·ç¦å¾·çä¼å¿å¨äºç ç©¶åå³ââéå¯¹èµæ³¨ãä½ è¦ç¼©å°è¿ä¸ªå·®è·çæ¹æ³ä¸æ¯æ¿èªå·±åä»å¯¹æ ï¼èæ¯èªå·±ååºä¸ä¸ªä¸æ¾ç¶çèµæ³¨å¹¶è¯æå®æ¯æ£ç¡®çãä½ å»ºç«è¯ä¼°å¥ä»¶çç´è§ï¼æ°æ°å°±æ¯é£ç§è½è®©ä½ è¾¾å°ç®æ çåå³å¹å »è¡å¨ãæå»ºå¥ä»¶ï¼æ¾å°ä¸ä¸ªå ±è¯é误çå°æ¹ï¼ç¶åè¯æå®ã
è¿ææ¯è½¨è¿¹ãç¾åæ¯ä¸æ¯å ³é®ââä¸ä¸ä¸ªèµæ³¨ææ¯ã
