Skip to content

Model qwen3 4b

hydropix edited this page Dec 23, 2025 · 1 revision

qwen3:4b

Ollama Model ID: qwen3:4b


Summary

Metric Value
Average Score 🟠 5.9/10
Accuracy 6.7/10
Fluency 5.8/10
Style 5.5/10
Languages Tested 19
Total Translations 95
Best Language Chinese (Traditional) (7.8)
Worst Language Hebrew (3.0)

Language Performance

Top Languages

Rank Language Overall Accuracy Fluency Style
1 Chinese (Traditional) 🟡 7.8 8.0 7.4 7.8
2 Chinese (Simplified) 🟡 7.4 7.6 7.2 7.0
3 French 🟠 6.8 7.4 6.6 6.4
4 Spanish 🟠 6.8 7.6 6.6 6.6
5 Italian 🟠 6.8 7.4 6.8 6.2
6 Portuguese 🟠 6.6 7.6 6.6 6.4
7 German 🟠 6.2 6.8 5.8 5.8
8 Vietnamese 🟠 6.0 7.0 6.0 5.6
9 Thai 🟠 6.0 6.8 6.0 5.6
10 Russian 🟠 5.8 6.8 5.8 5.6
View all 19 languages
Rank Language Overall Accuracy Fluency Style
1 Chinese (Traditional) 🟡 7.8 8.0 7.4 7.8
2 Chinese (Simplified) 🟡 7.4 7.6 7.2 7.0
3 French 🟠 6.8 7.4 6.6 6.4
4 Spanish 🟠 6.8 7.6 6.6 6.6
5 Italian 🟠 6.8 7.4 6.8 6.2
6 Portuguese 🟠 6.6 7.6 6.6 6.4
7 German 🟠 6.2 6.8 5.8 5.8
8 Vietnamese 🟠 6.0 7.0 6.0 5.6
9 Thai 🟠 6.0 6.8 6.0 5.6
10 Russian 🟠 5.8 6.8 5.8 5.6
11 Polish 🟠 5.6 6.6 5.6 5.4
12 Japanese 🟠 5.6 6.6 5.6 5.2
13 Korean 🟠 5.6 6.6 5.6 5.2
14 Arabic 🟠 5.6 6.6 5.4 5.4
15 Hindi 🟠 5.4 6.4 5.4 5.2
16 Bengali 🟠 5.2 6.2 5.2 4.8
17 Ukrainian 🟠 5.2 6.2 5.2 4.6
18 Tamil 🔴 4.0 4.8 4.2 3.4
19 Hebrew 🔴 3.0 4.0 3.0 2.8

Performance by Category

Asian Languages

Language Overall Accuracy Fluency Style
Chinese (Traditional) 🟡 7.8 8.0 7.4 7.8
Chinese (Simplified) 🟡 7.4 7.6 7.2 7.0
Vietnamese 🟠 6.0 7.0 6.0 5.6
Thai 🟠 6.0 6.8 6.0 5.6
Japanese 🟠 5.6 6.6 5.6 5.2
Korean 🟠 5.6 6.6 5.6 5.2
Hindi 🟠 5.4 6.4 5.4 5.2
Bengali 🟠 5.2 6.2 5.2 4.8
Tamil 🔴 4.0 4.8 4.2 3.4

Category Average: 🟠 5.9

European Major Languages

Language Overall Accuracy Fluency Style
French 🟠 6.8 7.4 6.6 6.4
Spanish 🟠 6.8 7.6 6.6 6.6
Italian 🟠 6.8 7.4 6.8 6.2
Portuguese 🟠 6.6 7.6 6.6 6.4
German 🟠 6.2 6.8 5.8 5.8
Polish 🟠 5.6 6.6 5.6 5.4

Category Average: 🟠 6.5

Cyrillic Languages

Language Overall Accuracy Fluency Style
Russian 🟠 5.8 6.8 5.8 5.6
Ukrainian 🟠 5.2 6.2 5.2 4.6

Category Average: 🟠 5.5

Semitic Languages

Language Overall Accuracy Fluency Style
Arabic 🟠 5.6 6.6 5.4 5.4
Hebrew 🔴 3.0 4.0 3.0 2.8

Category Average: 🔴 4.3


Translation Examples

Best Translation

French - Walden Score: 🟡 8.0/10

View Translation

Original:

Translation:

Je suis allé dans la forêt car je souhaitais vivre avec intention, affronter uniquement les faits essentiels de la vie et voir si je ne pouvais pas apprendre ce que celle-ci avait à enseigner, sans découvrir à ma mort que je n'avais pas vécu. Je ne voulais pas vivre ce qui n'était pas de la vie, car vivre est si précieux ; je n'entendais pas pratiquer la résignation, sauf dans le cas où elle était absolument nécessaire. Je voulais vivre profondément et tirer toute la substance vitale de la vie.

Feedback: The translation preserves the philosophical meaning and structure well, with faithful rendering of Thoreau's key concepts like deliberate living and extracting life's essence. Minor stylistic adjustments ('avec intention' for 'deliberately,' 'tirer toute la substance vitale' for 'suck out all the marrow') slightly soften the original's visceral intensity, and the rhythm is occasionally less emphatic than Thoreau's original cadence.

Worst Translation

Tamil - The Picture of Dorian Gray Score: ⚫ 2.0/10

View Translation

Original:

Translation:

அறையில் வெண்ணை பூவின் மிக மெல்லிய வாசனை நிறம்பியிருந்தது. அந்த வெள்ளை காற்று பூக்களில் வேறு வேறு செய்ததும், அறையின் திறந்த வாயிலில் லிலாக்கு பூவின் கடுமையான வாசனை அல்லது பின்னாட்டு வெட்டு பூவின் விரைவான வாசனை வந்தது. பர்சிய வாட்டு காற்களின் முக்கிய பகுதியில் அமர்ந்திருந்த லாபர்னம் பூவின் மாம்பு சுவை மற்றும் மாம்பு வாலை பூக்களின் வெளிச்சோள் அவர் பார்த்துக் கொண்டிருந்தார்.

Feedback: The translation contains severe accuracy errors, including mistranslations of key terms ("வெண்ணை" for roses is incorrect, "மாம்பு சுவை" means mango taste rather than honey-sweet), omissions of crucial elements (the divan, Lord Henry Wotton's name and action), and nonsensical phrases that obscure meaning. The prose is fragmented and unnatural in Tamil, completely failing to capture Wilde's aesthetic sensibility and lyrical style.


Score Distribution

Score Range Count Percentage
🟢 Excellent (9-10) 0 0.0%
🟡 Good (7-8) 28 29.5%
🟠 Acceptable (5-6) 53 55.8%
🔴 Poor (3-4) 11 11.6%
⚫ Failed (1-2) 3 3.2%

Performance Metrics

Metric Value
Average Translation Time 35799.0ms
Success Rate 100.0%

← Back to Home | All Models

Clone this wiki locally