November 2010 Archives

Sinnentleerter JMStV – Deutschland verbrennt Blogs

  • Posted on November 30, 2010 at 5:14 pm

Es ist endlich soweit. Es darf in Deutschland wieder gegen Publikationen vorgegangen werden. Die ersten Blogs brennen schon. Selbst das Blog von studiVZ geht am 31. Dezember 2010 offline.  Der Weg für eine gleichgeschaltete Internetlandschaft ist vorbereitet. Der Jugendmedienstaatsvertrag wurde beschlossen, unter anderem von den mittlerweile unwählbaren Grünen. Das bedeutet, daß Webinhalte ab 1. Januar 2011 mit einer Altersfreigabe gekennzeichnet werden müssen. Für Inhalte „ab 18” muß eine Zugangsbeschränkung implementiert werden. Nun gibt es Blogs und Webseiten, die schon seit 8 Jahren oder länger Inhalte im Netz publiziert haben. Jede(r) Betreiber(in) muß nun alle Inhalte auf eine geeignete Altersfreigabe prüfen, den Inhalt deklarieren und für Inhalte „ab 18” eine Zugangsbeschränkung oder eine Sendezeit implementieren. Das übersteigt die Resourcen vieler Blogs.

Noch dazu wird im Jugendmedienstaatsvertrag keine einheitliche Kennzeichnung geregelt. Zwar sollen die Beschränkungen über HTML Meta-Tags und eine spezielle Schnittstelle markiert und zur Verfügung gestellt werden, die nötigen Standards gibt’s aber nicht. Das juristische Chaos ist perfekt. Die Politik begreift nicht wieviel Schaden sie damit anrichtet. Der JMStV ist nicht durchdacht und schießt weit über das Ziel hinaus. Wie sinnvoll sind denn Sendezeiten für Webinhalte, wenn die Goethe-Institute der Bundesregierung in aller Herren und Frauen Zeitzonen verstreut sind? Man muß kennzeichnen, aber man hat keine Vorschrift wie genau das realisiert werden soll? Realitätsfremder geht es ja wohl nicht.

Ich empfehle zur Illustration die Webinhalte der deutschen Bundesregierung, aller Parteien und aller Politikerblogs auf Altersbeschränkungen zu überprüfen und fleißig abzumahnen.

HMS Lancastria

  • Posted on November 21, 2010 at 2:46 pm

Most people know of the sinking of the SS Lusitania or the RMS Titanic. Few know of RMS Lancastria and her fate. I was among this group until yesterday. Janet Dempsey tells about the sinking of the ship while it served as a troop transport evacuating the 2nd British Expeditionary Force from France in June 1940.The abstract of her podcast explains the impact of the disaster.

„…HMT Lancastria was sunk by a German bomber while evacuating troops from St Nazaire; over 9,000 troops were packed on board. The exact number of soldiers who died that day will never be known, though even the lowest estimates rank this as the worst British maritime disaster in history, with losses exceeding those of the Titanic and Lusitania combined. This talk attempts to explain why so many who were lost will never be accounted for.”

The British governenment imposed a ban on reporting about the sinking. This was due to the flow of bad news from the continent following the German invasion of France. The troop ship was bombed by a German Junkers Ju 88 bomber. Three of four bombs hit the RMS Lancastria, exploding below deck, and causing her to sink within 20 minutes. Only 2 of the 32 lifeboats could be launched. Nearby ships rescued thousands of troops, but many more perished in the sea.

The Lancastria Association of Scotland continues the tradition of a parade and remembrance service every year.

Samhain Debugging Session

  • Posted on November 1, 2010 at 1:09 am

Samhain hat meinen Blick etwas vernebelt. Ich bin gerade dabei meinen Indexer Code wieder einen Schritt weiter zu debuggen. Der Code leidet noch an zuviel wstring bzw. wchar_t (weil ich anfänglich CLucene verwendet habe), was zu vermehrten Stringkonversionen zwischen UTF-32 (so wird wstring unter GNU/Linux kodiert) und UTF-8 führt. Die letzten Stunden lang habe ich eine Fata Morgana verfolgt. Es ging um den Teil, der HTML Dateien erkennt, mittels libtidy alles in XHTML wandelt, damit dann mit Hilfe einer XSLT Transformation die HTML Tags entfernt werden können. Für diesen Schritt muß man die Kodierung passend machen. Blöderweise gibt es Webseiten, die zwar UTF-8 im HTML Kopf ankündigen, die aber trotzdem nicht-UTF-8 im Body liefern. Beim Debuggen habe ich zusätzlich noch in der Konsole Zeichen gesehen, die eigentlich nicht da sein sollten oder falsch kodiert waren. Nach mehreren GDB Sessions mit babylonischer Kodierungsverwirrung im Terminal habe ich schließlich gesehen, daß die umgewandelten Inhalte doch richtig in der Datenbank ankommen. Postgres sagt «UTF-8», und bei Stichproben mit psql paßt auch alles.

Soweit scheint der Konverter zu funktionieren. Jetzt kann ich mir dann wieder den nicht richtig importierten PDFs widmen. Eigentlich ist der Zustand dieser so toll „standardisierten” Formate unter aller Sau. Textextraktion sollte nicht soviele Schwierigkeiten machen. Ich bin gespannt welche Überraschungen bei den e-Book-Formaten auftauchen.

Ich wünsche auf jeden Fall schon mal ein erfolgreiches neues Jahr (welches heute begonnen hat).

!DSPAM:4cce04cd188491837616446!

  • Comments are off for Samhain Debugging Session

Top