2012-03-23

(ro) Kmkz sunt în față!

Săptămânalul Kamikaze și-a schimbat înfățișarea în mediul electronic. Am făcut câteva teste pe tableta HP TouchPad rulând Android 2.3 (Cyanogen Mod).

Android este unul dintre sistemele de operare, foarte utilizate pe dispozitivele mobile, care nu poate afișa ț-ul cu virgulă.

Săptămânalul Kamikaze este unul dintre singurele săptămânale scrise în preponderență cu diacriticele corecte (ș și ț cu virgulă). Versiunea precedentă a ediției online se vedea astfel (în Firefox):


Se pot observa cu ușurință pătrățelele de unde lipsește ț-ul. Varianta actuală arată astfel (tot în Firefox):


Noua variantă arată cu mult mai bine, aproape perfect dacă n-ar fi fost pătrățelele din colțul stânga jos.

Dar de ce se văd restul de ț? Kamikaze este primul săptămânal din România care folosește tehnica @font-face de afișare a diacriticelor, tehnică pe care am descris-o în articolul Browsere Moderne II (29.04.2010), tehnică care implică descărcarea unui font de pe situl Kamikaze și folosirea lui de către browser pentru a randa pagina.

Kamikaze folosește familia de fonturi Futura. Mai jos avem un fragment din codul CSS:
@font-face {
  font-family: 'FuturaRoCEPlain';
  src: url('fonts/futura/futuraroce-webfont.eot');
  src: url('fonts/futura/futuraroce-webfont.eot?#iefix') format('embedded-opentype'),
    url('fonts/futura/futuraroce-webfont.woff') format('woff'),
    url('fonts/futura/futuraroce-webfont.ttf') format('truetype'),
    url('fonts/futura/futuraroce-webfont.svg#FuturaRoCEPlain') format('svg');

  font-weight: normal;
  font-style: normal;
}
Capturile de ecran de mai sus au fost făcute cu Firefox 10.0.3. Am testat și alte browsere, precum:

Browserul implicit cu care vine Android 2.3 (bazat pe motorul Webkit):
 
Dolphin 7.6.0 (bazat pe motorul Webkit)


Opera 12.00

La browserele de mai sus s-a afișat inițial versiunea mobilă a saitului, versiune care nu vine cu o protecție la diacritice, și ț-ul lipsă lovește din plin. În principiu versiunea mobilă a unui sait este o versiune mult mai „ușoară”, pentru a fi descărcată repede peste o conexiune 3G.

Pentru versiunea mobilă s-ar fi putut folosi tehnica de detecție a diacriticelor problematice prezentată în articolul Diacriticele și internetul (30.10.2010). Scriptul diacritice.js (varianta „compilată”) are doar 1.5KB, față de futuraroce-webfont.ttf care are 24KB în mărime.

Se pare că Opera este singurul browser care a respectat directiva @font-face peste tot, nu se văd pătrățele deloc în varianta „desktop”.

Am menționat faptul că săptămânalul Kamikaze este scris în preponderență cu diacriticele corecte deoarece există și articole scrise cu diacriticele vechi. Vezi captura de ecran de mai jos:


Diacriticele vechi nu au fost incluse în fontul FuturaROCE și ele sunt „emulate” folosind un alt font, iar rezultatul este urâțel pe mașina mea cu Windows 7.

Diacriticele vechi sunt introduse de obicei cu aranjamentul de tastatură „Legacy” din Windows (prezent de la Windows 3.11 încoace)  Pentru cei familiarizați cu acest aranjament am creat un aranjament identic, dar care are diacriticele vechi schimbate cu cele noi.

Pachetul de instalare universal pentru Windows XP, Vista, 7, 32 sau 64 de biți, poate fi descărcat de aici: legacy_fixed (202 KB). Pachetul de instalare este semnat digital, pentru mai multă siguranță :)
Am creat acest aranjament de tastatură folosind Microsoft Keyboard Layout Creator 1.4, iar dezinstalarea se face din „Control Panel -> Add Remove Programs” și acolo căutați după „Romanian (Legacy) - Fixed”.

Kamikaze sunt în fața competiției și sper să dea un exemplu presei online românești! Textele se scriu cu diacriticele corecte în Web 2.0!

P.S.

Am făcut un filmuleț în care prezint instalarea „progrămelului” legacy_fixed.exe pe un Windows XP fără fonturile actualizate.



2012-03-05

Windows 8 Consumer Preview and the Romanian Language

In this blog entry I will present a few issues gathered in a short test drive of Windows 8 Consumer Preview. If you are not interested in these Romanian issues, please stop reading here :)

The fonts

In the blog entry named Windows 7 and the Romanian Language I've did a bit of nit picking regarding the font families found on Windows 7.

As it turns out, Microsoft didn't fix the font family problems in Windows 8 Consumer Preview. Bad.




The language shortened name

Windows 7 had the Romanian language shortened to "RO", which was perfectly fine. Windows 8 has the Romanian language shortened to "RUM". This came a bit of a shock even though I knew the German translation, namely "Rumänisch".


"RO" short name was standardized by ISO 639-1. "RUM" short name was standardized by ISO 639-2, standard which was based on the MARC Code List for Language of the Library of Congress. There is also a ISO 639-3 standard which has Romanian shortened to "RON", but that's not good either, since the Romanian currency is also shortened to "RON".

If you ask any Romanian how should (s)he shorten the name of the Romanian language (limba Română), (s)he will say "ROM". As it turns out, "ROM" is also present in the ISO 639-2 standard, it marks the shortened form of Romany language.

This is not Microsoft's fault, but I think "RON" is better than "RUM". Baddish.

Retro translations


If you ask anybody from Microsoft which characters (şţ cedilla or șț comma below) should be used in Romanian translations, they will point you to this web page and they will correctly say that the comma below characters are to be used. I've seen such a discussion between Nokia and Microsoft.

But then why is the bing page above translated with the old cedilla characters? I can think of two possibilities:
  1. They've outsourced the translation to a firm which uses the Windows Legacy Romanian keyboard layout (like since Windows 3.11)
  2. The usage of the old cedilla characters was intentional because of problems on some operating systems which have problems displaying the new comma below characters (Android prior to version 3, Windows XP with IE6, WebOS etc)
I wish Microsoft would remove the Legacy keyboard layout in Windows 8. How long will it be supported? At least please change the şţ cedilla characters with the șț comma below characters in the Legacy keyboard layout

The latter problem can be fixed by using a small piece of Javascript code to detect if  the width of "stST" string is the same as the width of the "șțȘȚ" string. If they are the same width then the browser can display the new comma below characters. If not, then it means that the browser is using a different font to substitute the characters, or it is using empty square characters, in which casejust replace the correct comma below characters with the more portable cedilla characters.

I've presented this Javascript detection technique in this blog entry (Romanian): Diacriticele și Internetul. The MIT licensed Javascript code is located here.

Retro translations? Bad

Maps


Besides the fact that the old cedilla ţ is being used in "Constanţa", there is nothing wrong with the page. This is good, it used to be wrongly rendered a month ago. Fixed rendering? Good.

Thank you Microsoft, please correct the map data so that you are using the correct comma below characters. Old characters? Bad


We'll see how Windows 8 RTM will look like in a couple of months.