-
Notifications
You must be signed in to change notification settings - Fork 56
Language polish
Category: European Major Languages Script: Latin
| Metric | Value |
|---|---|
| Average Score | 🟠 6.1/10 |
| Accuracy | 6.7/10 |
| Fluency | 6.1/10 |
| Style | 5.8/10 |
| Total Tests | 75 |
| Best Model | mistralai/mistral-medium-3.1 |
| Worst Model | llama3.2 |
| Model | Overall | Accuracy | Fluency | Style |
|---|---|---|---|---|
| mistralai/mistral-medium-3.1 | 🟡 7.8 | 8.0 | 7.8 | 7.6 |
| ministral-3:14b | 🟡 7.6 | 8.0 | 7.4 | 7.2 |
| gemma3:27b-it-qat | 🟡 7.4 | 7.6 | 7.4 | 7.0 |
| gemma3:27b | 🟡 7.2 | 7.6 | 7.4 | 7.0 |
| qwen3:30b | 🟠 6.6 | 7.4 | 6.4 | 6.4 |
| qwen3:30b-instruct | 🟠 6.6 | 7.0 | 6.8 | 6.4 |
| mistral-small:24b | 🟠 6.4 | 7.4 | 6.4 | 6.2 |
| gemma3:12b | 🟠 6.4 | 7.0 | 6.4 | 6.0 |
| qwen3:14b | 🟠 6.2 | 6.8 | 6.0 | 5.8 |
| ministral-3 | 🟠 6.0 | 6.8 | 6.0 | 5.8 |
| qwen3:4b | 🟠 5.6 | 6.6 | 5.6 | 5.4 |
| gemma3:4b | 🟠 5.6 | 6.2 | 5.8 | 5.0 |
| qwen3:8b | 🟠 5.4 | 6.4 | 5.4 | 5.2 |
| llama3.1:8b | 🔴 4.8 | 5.6 | 4.8 | 4.2 |
| llama3.2 | ⚫ 2.0 | 2.6 | 2.0 | 1.6 |
Model: mistralai/mistral-medium-3.1 Score: 🟢 9.0/10
View Translation
Original (English):
Translation (Polish):
— Był pan chyba w Afganistanie, domyślam się. — Skąd, u licha, pan wie? — zapytałem zdumiony. — Nie ma sprawy — odparł, chichocząc pod nosem. — Teraz chodzi o hemoglobinę. Z pewnością dostrzega pan znaczenie mojego odkrycia? — Bez wątpienia jest ciekawe pod względem chemicznym — odpowiedziałem — ale pod względem praktycznym… — Ależ, człowieku, to najpraktyczniejsze odkrycie medycyny sądowej od lat! Nie rozumie pan, że daje nam nieomylny test na plamy krwi?
Evaluator Feedback:
The translation faithfully preserves the meaning and dialogue dynamics of the original, with excellent naturalization of Holmes's deductive manner and Watson's astonishment. Minor stylistic variations (e.g., 'u licha' for 'on earth', 'hemoglobinę' spelling) are appropriate Polish equivalents that maintain the period tone and character voices effectively.
Model: gemma3:27b-it-qat Score: 🟡 8.0/10
View Translation
Original (English):
Translation (Polish):
– Widzę, że byłeś w Afganistanie – zauważył. – Skąd, do diabła, o tym wiesz? – zapytałem z osłupieniem. – Nie przejmuj się – odparł, rechotając pod nosem. – Teraz istotne jest pytanie o hemoglobinę. Nie wątpię, że dostrzegasz znaczenie tego mojego odkrycia? – Ciekawe, niewątpliwie pod względem chemicznym – odpowiedziałem – ale w praktyce… – Cóż, to najważniejsze odkrycie medyczno-sądowe od lat. Czyż nie widzisz, że daje nam ono niezawodny test na plamy krwi?
Evaluator Feedback:
The translation accurately preserves the meaning and dialogue flow of the original, with natural Polish phrasing and appropriate character voice. Minor points: 'rechotając pod nosem' is slightly less precise than 'chuckling to himself,' and the exclamatory 'Cóż' slightly softens Holmes's assertiveness, but these are negligible deviations.
Model: gemma3:27b-it-qat Score: 🟡 8.0/10
View Translation
Original (English):
Translation (Polish):
Poszedłem do lasu, ponieważ chciałem żyć świadomie, stanąć twarzą w twarz z najważniejszymi prawdami życia i zobaczyć, czy nie mógłbym się czegoś nauczyć, i nie odkryć, gdy nadejdzie śmierć, że w ogóle nie żyłem. Nie chciałem żyć życiem, które nie jest życiem, bo życie jest tak cenne; nie chciałem też ćwiczyć rezygnacji, chyba że byłaby absolutnie konieczna. Chciałem żyć głęboko i wydobyć z życia wszystkie soki.
Evaluator Feedback:
The translation faithfully preserves Thoreau's meaning and philosophical intent, with strong rendering of key concepts like 'deliberately' (świadomie) and 'essential facts' (najważniejsze prawdy). Minor fluency issues exist ('stanąć twarzą w twarz' is slightly more literal than necessary, and 'wydobyć z życia wszystkie soki' for 'suck out all the marrow' is idiomatic but slightly less visceral), yet the contemplative, deliberate tone and rhythmic quality of the original are well maintained throu
| Score Range | Count | Percentage |
|---|---|---|
| 🟢 Excellent (9-10) | 1 | 1.3% |
| 🟡 Good (7-8) | 33 | 44.0% |
| 🟠 Acceptable (5-6) | 31 | 41.3% |
| 🔴 Poor (3-4) | 6 | 8.0% |
| ⚫ Failed (1-2) | 4 | 5.3% |