è¿œç¨‹ç›‘æŽ§åŸ¹è®è¿›åº¦ | AIç”Ÿæˆå’Œç¿»è¯‘

Home 2026.04

ä½ çš„ç›´è§‰å…¶å®žéžå¸¸å‡†ç¡®â€”â€”è®ç»ƒæ¨¡åž‹ç¡®å®žåƒä¸€æ¬¡æ¼«é•¿çš„â€å•è‚²â€è¿‡ç¨‹ã€‚ä½†ä¸Žç”Ÿç‰©å¦ä¸åŒçš„æ˜¯ï¼Œè¿™ä¸ªè¿‡ç¨‹å®Œå…¨å¯è¢«ç›‘æŽ§å’Œé¢„æµ‹ã€‚

è®©æˆ‘ä»¬åˆ†ä¸¤éƒ¨åˆ†è®¨è®ºï¼š(1) å¦‚ä½•è¿œç¨‹æ£€æŸ¥è¿›åº¦ å’Œ (2) å¦‚ä½•é€šè¿‡AI/æ—¥å¿—ä¼°ç®—å‰©ä½™æ—¶é—´ã€‚

1. å¦‚ä½•æ£€æŸ¥è®ç»ƒè¿›åº¦ï¼ˆå¤œé—´åŒæ ·é€‚ç”¨ï¼‰

A. åŸºäºŽæ—¥å¿—çš„ç›‘æŽ§ï¼ˆæœ€å…³é”®ï¼‰

nanoGPTä¼šæ‰“å°å¦‚ä¸‹æ—¥å¿—ï¼š

iter 12000: loss 2.34, time 120ms

ä»Žä¸ä½ å¯ä»¥èŽ·å–ï¼š

å½“å‰è¿ä»£æ¬¡æ•°
æŸå¤±è¶‹åŠ¿
å•æ¬¡è¿ä»£æ—¶é—´

ðŸ‘‰ ä½ åº”è¯¥å°†æ—¥å¿—é‡å®šå‘åˆ°æ–‡ä»¶ï¼š

python train.py > train.log 2>&1

è¿œç¨‹æŸ¥çœ‹ï¼š

tail -f train.log

ä»…æ¤ä¸€é¡¹å°±èƒ½æä¾›å®žæ—¶å¯è§æ€§ã€‚

B. è¿œç¨‹è®¿é—®ï¼ˆç®€å•è®¾ç½®ï¼‰

å¦‚æžœè®ç»ƒæœºåœ¨è¿œç¨‹ï¼š

ä½¿ç”¨SSHï¼š
```
ssh your_server
```
ä½¿ç”¨tmuxæˆ–screenï¼ˆéžå¸¸é‡è¦ï¼‰ï¼š
```
tmux new -s training
```

è¿™èƒ½ç¡®ä¿ï¼š

å³ä½¿æ–å¼€è¿žæŽ¥è®ç»ƒä»æŒç»è¿è¡Œ
éšæ—¶é‡æ–°è¿žæŽ¥ï¼š
```
tmux attach -t training
```

C. GPUç›‘æŽ§ï¼ˆçŠ¶æ€æ£€æŸ¥ï¼‰

watch -n 1 nvidia-smi

å¯æŸ¥çœ‹ï¼š

GPUåˆ©ç”¨çŽ‡ï¼ˆåº”ä¿æŒé«˜ä½ï¼Œå¦‚90%ä»¥ä¸Šï¼‰
å†…å˜ä½¿ç”¨é‡
æ¸©åº¦

å¦‚æžœGPUåˆ©ç”¨çŽ‡é™è‡³0% â†’ è®ç»ƒå¯èƒ½åœæ»žæˆ–å´©æºƒã€‚

D. å¯é€‰ï¼šWebä»ªè¡¨æ¿ï¼ˆæ›´å¥½ä½“éªŒï¼‰

å¦‚éœ€æ›´â€AIåŽŸç”Ÿâ€çš„ç›‘æŽ§ä½“éªŒï¼š

TensorBoardï¼š
```
tensorboard --logdir=out
```
æˆ–è®°å½•åˆ°ï¼š
- Weights & Biases (wandb)
- MLflow

è¿™æ ·å¯éšæ—¶éšåœ°é€šè¿‡æ‰‹æœºæŸ¥çœ‹è¿›åº¦ã€‚

2. ä¼°ç®—è®ç»ƒä½•æ—¶å®Œæˆ

è¿™é‡Œå°±æ¶‰åŠåˆ°â€ç”¨AIé¢„æµ‹å®Œæˆæ—¶é—´â€çš„æƒ³æ³•â€”â€”è¿™æ˜¯å®Œå…¨å¯è¡Œçš„ã€‚

æ–¹æ³•ä¸€ï¼šç®€å•ç¡®å®šæ€§ä¼°ç®—

ä»Žæ—¥å¿—èŽ·å–ï¼š

å½“å‰è¿ä»£æ¬¡æ•° = i
æœ€å¤§è¿ä»£æ¬¡æ•° = max_iters
å¹³å‡å•æ¬¡è¿ä»£æ—¶é—´ = t

è®¡ç®—ï¼š

å‰©ä½™æ—¶é—´ = (max_iters - i) * t

ç¤ºä¾‹ï¼š

max_iters = 600,000
å½“å‰è¿›åº¦ = 120,000
å•æ¬¡è¿ä»£æ—¶é—´ = 0.12 ç§’

å‰©ä½™æ—¶é—´ = (600k - 120k) * 0.12 â‰ˆ 57,600 ç§’ â‰ˆ 16 å°æ—¶

ðŸ‘‰ è¿™å·²ç»ç›¸å½“ç²¾ç¡®ã€‚

æ–¹æ³•äºŒï¼šæ™ºèƒ½ä¼°ç®—ï¼ˆAIé£Žæ ¼ï¼‰

ä½ å¯ä»¥ï¼š

è§£æžtrain.log
è®¡ç®—è¿ä»£æ—¶é—´çš„ç§»åŠ¨å¹³å‡å€¼
æ£€æµ‹é€Ÿåº¦ä¸‹é™ï¼ˆå¦‚æ£€æŸ¥ç‚¹ä¿å˜ã€è¯„ä¼°é˜¶æ®µï¼‰

ç„¶åŽä¼˜åŒ–ä¼°ç®—ã€‚

ç”šè‡³å¯ä»¥å†™ä¸ªå°è„šæœ¬ï¼š

import re

iters = []
times = []

with open("train.log") as f:
    for line in f:
        m = re.search(r"iter (\d+).*time ([\d.]+)ms", line)
        if m:
            iters.append(int(m.group(1)))
            times.append(float(m.group(2)))

avg_time = sum(times[-100:]) / 100 / 1000  # ç§’
current_iter = iters[-1]

max_iters = 600000
remaining = (max_iters - current_iter) * avg_time

print("é¢„è®¡å‰©ä½™æ—¶é—´ï¼ˆå°æ—¶ï¼‰ï¼š", remaining / 3600)

æ–¹æ³•ä¸‰ï¼šè¯¢é—®AIï¼ˆå¦‚ä½ æ‰€æƒ³ï¼‰

ä½ å¯ä»¥ç›´æŽ¥å°†æœ€è¿‘çš„æ—¥å¿—ç²˜è´´æé—®ï¼š

â€œæ ¹æ®å½“å‰è®ç»ƒé€Ÿåº¦è¶‹åŠ¿ï¼Œé¢„è®¡ä½•æ—¶å®Œæˆï¼Ÿâ€

AIèƒ½å¤Ÿï¼š

å¹³æ»‘å™ªå£°æ—¶é—´æ•°æ®
æ£€æµ‹å¼‚å¸¸æƒ…å†µ
ä¼°ç®—å®Œæˆæ—¶é—´

æ•ˆæžœå‡ºå¥‡åœ°å¥½ã€‚

3. è¿›é˜¶ï¼šè¥é€ â€ç”Ÿå‘½æ„Ÿâ€ï¼ˆå‘¼åº”ä½ çš„æ¯”å–»ï¼‰

æŸå¤±æ›²çº¿ â†’ â€œå¦ä¹ è¿›åº¦â€
éªŒè¯æŸå¤± â†’ â€œæ³›åŒ–æˆç†Ÿåº¦â€
ç”Ÿæˆæ ·æœ¬ â†’ â€œä¸ªæ€§æ˜¾çŽ°â€

nanoGPTç”šè‡³æ”¯æŒå®šæœŸç”Ÿæˆæ–‡æœ¬ï¼š

python sample.py

è¿™å°±åƒï¼š

â€œè®©æˆ‘çœ‹çœ‹æˆ‘çš„å©åçŽ°åœ¨è¯´è¯æ€Žä¹ˆæ ·äº†â€

4. å®žè·µå»ºè®®ï¼ˆæŽ¨èæœ€å°åŒ–æ–¹æ¡ˆï¼‰

å¦‚éœ€ç®€æ´çš„è®¾ç½®ï¼š

tmux â†’ ä¿æŒä»»åŠ¡è¿è¡Œ
train.log â†’ æŒä¹…åŒ–æ—¥å¿—
ç®€å•Pythonè„šæœ¬ â†’ ä¼°ç®—å®Œæˆæ—¶é—´
å¯é€‰çš„wandb â†’ è¿œç¨‹å¯è§†åŒ–

æ ¸å¿ƒè¦ç‚¹

ä¼°ç®—å®Œæˆæ—¶é—´æ— éœ€å¤æ‚å·¥å…·â€”â€”æ—¥å¿—å·²åŒ…å«æ‰€æœ‰ä¿¡æ¯

å¦‚æžœä½ éœ€è¦ï¼Œæˆ‘å¯ä»¥å¸®ä½ æž„å»ºä¸€ä¸ªä¸€é”®ç›‘æŽ§è„šæœ¬ï¼Œèƒ½å¤Ÿï¼š

è§£æžæ—¥å¿—
æ˜¾ç¤ºé¢„è®¡å®Œæˆæ—¶é—´
å±•ç¤ºè®ç»ƒé€Ÿåº¦è¶‹åŠ¿
è®ç»ƒåœæ»žæ—¶å‘å‡ºè¦æŠ¥

è¿™å°†ä½¿ä½ çš„â€åˆå¤œæ£€æŸ¥â€æ›´åŠ é¡ºç•…ã€‚

Back Donate

Sunbelt Computer Software

PL/B Language Development and Support

è¿œç¨‹ç›‘æŽ§åŸ¹è®è¿›åº¦ | AIç”Ÿæˆå’Œç¿»è¯‘

1. å¦‚ä½•æ£€æŸ¥è®ç»ƒè¿›åº¦ï¼ˆå¤œé—´åŒæ ·é€‚ç”¨ï¼‰

A. åŸºäºŽæ—¥å¿—çš„ç›‘æŽ§ï¼ˆæœ€å…³é”®ï¼‰

B. è¿œç¨‹è®¿é—®ï¼ˆç®€å•è®¾ç½®ï¼‰

C. GPUç›‘æŽ§ï¼ˆçŠ¶æ€æ£€æŸ¥ï¼‰

D. å¯é€‰ï¼šWebä»ªè¡¨æ¿ï¼ˆæ›´å¥½ä½“éªŒï¼‰

2. ä¼°ç®—è®ç»ƒä½•æ—¶å®Œæˆ

æ–¹æ³•ä¸€ï¼šç®€å•ç¡®å®šæ€§ä¼°ç®—

æ–¹æ³•äºŒï¼šæ™ºèƒ½ä¼°ç®—ï¼ˆAIé£Žæ ¼ï¼‰

æ–¹æ³•ä¸‰ï¼šè¯¢é—®AIï¼ˆå¦‚ä½ æ‰€æƒ³ï¼‰

3. è¿›é˜¶ï¼šè¥é€ â€ç”Ÿå‘½æ„Ÿâ€ï¼ˆå‘¼åº”ä½ çš„æ¯”å–»ï¼‰

4. å®žè·µå»ºè®®ï¼ˆæŽ¨èæœ€å°åŒ–æ–¹æ¡ˆï¼‰

æ ¸å¿ƒè¦ç‚¹

Sunbelt Computer Software

PL/B Language Development and Support

è¿œç¨‹ç›‘æŽ§åŸ¹è®­è¿›åº¦ | AIç”Ÿæˆå’Œç¿»è¯‘

1. å¦‚ä½•æ£€æŸ¥è®­ç»ƒè¿›åº¦ï¼ˆå¤œé—´åŒæ ·é€‚ç”¨ï¼‰

A. åŸºäºŽæ—¥å¿—çš„ç›‘æŽ§ï¼ˆæœ€å…³é”®ï¼‰

B. è¿œç¨‹è®¿é—®ï¼ˆç®€å•è®¾ç½®ï¼‰

C. GPUç›‘æŽ§ï¼ˆçŠ¶æ€æ£€æŸ¥ï¼‰

D. å¯é€‰ï¼šWebä»ªè¡¨æ¿ï¼ˆæ›´å¥½ä½“éªŒï¼‰

2. ä¼°ç®—è®­ç»ƒä½•æ—¶å®Œæˆ

æ–¹æ³•ä¸€ï¼šç®€å•ç¡®å®šæ€§ä¼°ç®—

æ–¹æ³•äºŒï¼šæ™ºèƒ½ä¼°ç®—ï¼ˆAIé£Žæ ¼ï¼‰

æ–¹æ³•ä¸‰ï¼šè¯¢é—®AIï¼ˆå¦‚ä½ æ‰€æƒ³ï¼‰

3. è¿›é˜¶ï¼šè¥é€ â€ç”Ÿå‘½æ„Ÿâ€ï¼ˆå‘¼åº”ä½ çš„æ¯”å–»ï¼‰

4. å®žè·µå»ºè®®ï¼ˆæŽ¨èæœ€å°åŒ–æ–¹æ¡ˆï¼‰

æ ¸å¿ƒè¦ç‚¹

è¿œç¨‹ç›‘æŽ§åŸ¹è®è¿›åº¦ | AIç”Ÿæˆå’Œç¿»è¯‘

1. å¦‚ä½•æ£€æŸ¥è®ç»ƒè¿›åº¦ï¼ˆå¤œé—´åŒæ ·é€‚ç”¨ï¼‰

B. è¿œç¨‹è®¿é—®ï¼ˆç®€å•è®¾ç½®ï¼‰

C. GPUç›‘æŽ§ï¼ˆçŠ¶æ€æ£€æŸ¥ï¼‰

D. å¯é€‰ï¼šWebä»ªè¡¨æ¿ï¼ˆæ›´å¥½ä½“éªŒï¼‰

2. ä¼°ç®—è®ç»ƒä½•æ—¶å®Œæˆ

æ–¹æ³•ä¸€ï¼šç®€å•ç¡®å®šæ€§ä¼°ç®—

3. è¿›é˜¶ï¼šè¥é€ â€ç”Ÿå‘½æ„Ÿâ€ï¼ˆå‘¼åº”ä½ çš„æ¯”å–»ï¼‰

4. å®žè·µå»ºè®®ï¼ˆæŽ¨èæœ€å°åŒ–æ–¹æ¡ˆï¼‰

æ ¸å¿ƒè¦ç‚¹