Skip to content

Model qwen3 30b instruct

hydropix edited this page Dec 23, 2025 · 1 revision

qwen3:30b-instruct

Ollama Model ID: qwen3:30b-instruct


Summary

Metric Value
Average Score 🟠 6.6/10
Accuracy 7.2/10
Fluency 6.6/10
Style 6.2/10
Languages Tested 19
Total Translations 95
Best Language Chinese (Simplified) (8.0)
Worst Language Hebrew (4.6)

Language Performance

Top Languages

Rank Language Overall Accuracy Fluency Style
1 Chinese (Simplified) 🟡 8.0 8.2 8.0 7.6
2 French 🟡 7.8 7.8 8.0 7.6
3 Portuguese 🟡 7.8 8.6 7.8 7.6
4 Spanish 🟡 7.6 7.8 7.6 7.0
5 Chinese (Traditional) 🟡 7.4 7.6 7.4 7.0
6 German 🟡 7.0 7.6 7.0 6.8
7 Italian 🟡 7.0 7.4 7.2 6.4
8 Russian 🟡 7.0 7.6 7.0 6.6
9 Vietnamese 🟠 6.8 7.4 6.6 6.6
10 Polish 🟠 6.6 7.0 6.8 6.4
View all 19 languages
Rank Language Overall Accuracy Fluency Style
1 Chinese (Simplified) 🟡 8.0 8.2 8.0 7.6
2 French 🟡 7.8 7.8 8.0 7.6
3 Portuguese 🟡 7.8 8.6 7.8 7.6
4 Spanish 🟡 7.6 7.8 7.6 7.0
5 Chinese (Traditional) 🟡 7.4 7.6 7.4 7.0
6 German 🟡 7.0 7.6 7.0 6.8
7 Italian 🟡 7.0 7.4 7.2 6.4
8 Russian 🟡 7.0 7.6 7.0 6.6
9 Vietnamese 🟠 6.8 7.4 6.6 6.6
10 Polish 🟠 6.6 7.0 6.8 6.4
11 Thai 🟠 6.6 7.6 6.6 6.4
12 Ukrainian 🟠 6.6 7.4 6.6 6.4
13 Arabic 🟠 6.6 7.2 6.6 6.0
14 Japanese 🟠 6.2 6.8 6.2 5.6
15 Korean 🟠 6.0 6.8 6.0 5.6
16 Hindi 🟠 5.8 6.8 5.8 5.6
17 Bengali 🟠 5.2 6.2 5.2 5.0
18 Tamil 🔴 4.6 5.6 4.6 4.2
19 Hebrew 🔴 4.6 5.4 4.6 4.2

Performance by Category

Asian Languages

Language Overall Accuracy Fluency Style
Chinese (Simplified) 🟡 8.0 8.2 8.0 7.6
Chinese (Traditional) 🟡 7.4 7.6 7.4 7.0
Vietnamese 🟠 6.8 7.4 6.6 6.6
Thai 🟠 6.6 7.6 6.6 6.4
Japanese 🟠 6.2 6.8 6.2 5.6
Korean 🟠 6.0 6.8 6.0 5.6
Hindi 🟠 5.8 6.8 5.8 5.6
Bengali 🟠 5.2 6.2 5.2 5.0
Tamil 🔴 4.6 5.6 4.6 4.2

Category Average: 🟠 6.3

European Major Languages

Language Overall Accuracy Fluency Style
French 🟡 7.8 7.8 8.0 7.6
Portuguese 🟡 7.8 8.6 7.8 7.6
Spanish 🟡 7.6 7.8 7.6 7.0
German 🟡 7.0 7.6 7.0 6.8
Italian 🟡 7.0 7.4 7.2 6.4
Polish 🟠 6.6 7.0 6.8 6.4

Category Average: 🟡 7.3

Cyrillic Languages

Language Overall Accuracy Fluency Style
Russian 🟡 7.0 7.6 7.0 6.6
Ukrainian 🟠 6.6 7.4 6.6 6.4

Category Average: 🟠 6.8

Semitic Languages

Language Overall Accuracy Fluency Style
Arabic 🟠 6.6 7.2 6.6 6.0
Hebrew 🔴 4.6 5.4 4.6 4.2

Category Average: 🟠 5.6


Translation Examples

Best Translation

French - Pride and Prejudice Score: 🟢 9.0/10

View Translation

Original:

Translation:

Il est une vérité universellement reconnue qu’un homme célibataire, possédant une fortune considérable, doit nécessairement chercher une épouse. Quoique les sentiments ou les pensées de pareil homme puissent rester inconnus lorsqu’il arrive pour la première fois dans une région, cette vérité est si bien ancrée dans l’esprit des familles environnantes qu’il est considéré comme le bien légitime de l’une ou l’autre de leurs filles.

Feedback: The translation faithfully preserves Austen's ironic opening with excellent semantic fidelity and natural French prose. Minor stylistic variations ("région" for neighborhood, "bien légitime" for property) are appropriate domestications that maintain the satirical tone and formal register of the original.

Worst Translation

Tamil - The Picture of Dorian Gray Score: 🔴 3.0/10

View Translation

Original:

Translation:

நிலையம் மலர்களின் தேங்காய் மணத்தால் நிரம்பியிருந்தது, மற்றும் கொண்டு வந்த காலை காற்று தோட்டத்தில் உள்ள மரங்களில் கலக்கும்போது, திறந்த வாயில் வழியாக லிலாக்கு மணம் அல்லது பொன்னிற மலர்கள் கொண்ட சிறிய கொடிகளின் நேர்த்தியான மணம் உள்ளே வந்தது. பெர்சிய குடைகளால் நிரம்பிய மாடு மேடையின் கோணத்தில், அவன் தனது வழக்கமான போல் புகைப்பிடிக்க அமர்ந்திருந்தபோது, பல புகைப்பிடிகள் செல்லும் வழியில், லாபர்னம் மலர்களின் தேங்காய் சுவையும் தேங்காய் நிறமும் கொண்ட மலர்களின் மின்னலை லார்ட் ஹென்றி வாட்டன் கவனிக்க முடிந்தது.

Feedback: The translation contains significant errors including mistranslations ("தேங்காய்" means coconut, not rose; "நிலையம்" means station, not studio; "குடைகள்" means umbrellas, not saddle-bags) and severely compromised sentence structure that obscures meaning. The aesthetic sensibility and lyrical quality of Wilde's prose are completely lost in awkward, fragmented Tamil that reads as machine-generated rather than literary translation.


Score Distribution

Score Range Count Percentage
🟢 Excellent (9-10) 2 2.1%
🟡 Good (7-8) 54 56.8%
🟠 Acceptable (5-6) 32 33.7%
🔴 Poor (3-4) 7 7.4%
⚫ Failed (1-2) 0 0.0%

Performance Metrics

Metric Value
Average Translation Time 1520.0ms
Success Rate 100.0%

← Back to Home | All Models

Clone this wiki locally