Folks,<br><br>thank you all for your suggestions!<br><br>Kind regards,<br>Laszlo<br><br><div class="gmail_quote">2011/3/28 Martin Hepp <span dir="ltr"><<a href="mailto:martin.hepp@ebusiness-unibw.org">martin.hepp@ebusiness-unibw.org</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Dear Laszlo:<br>
<br>
You do not have to polish an existing HTML4 or buggy HTML page into valid XHTML or HTML5 before adding GoodRelations in RDFa.<br>
<br>
Most RDFa parsers, e.g. PyRDFa, are able to correctly extract RDF from RDFa in "buggy" HTML markup.<br>
<br>
However, the cleaner the markup, the more reliable the extraction, so you make your pages more accessible for novel search engines if your markup is consistent.<br>
<br>
Buggy markup is more problematic if you use RDFa closely interwoven with existing visible page content, it is less of a problem if you use RDFa in "snippet style".<br>
<br>
For more info, see <a href="http://www.ebusiness-unibw.org/wiki/RDFaAuthoring#RDFa_in_Snippet_Style" target="_blank">http://www.ebusiness-unibw.org/wiki/RDFaAuthoring#RDFa_in_Snippet_Style</a><br>
<br>
In general: Lack of well-formedness is more problematic than e.g. misspelt HTML element names or invalid attributes (e.g. missing "alt" for images). The main obstacle for RDFa parsers are those cases where they have to guess the position of a missing closing element.<br>

<br>
<br>
Bottom-line: If you can keep your page valid XHTML, try to do that. But if can't, this should not stop you from adding GoodRelations to your page. GoodRelations in RDFa in a page not yet being valid XHTML or HTML5 is better than no GoodRelations ;-)<br>

<br>
Best wishes<br>
<font color="#888888"><br>
Martin Hepp<br>
</font><div><div></div><div class="h5"><br>
<br>
On Mar 28, 2011, at 11:14 AM, László Török wrote:<br>
<br>
> Hi,<br>
><br>
> I've started to play around with the GoodRelations vocab recently, after trying to add RDFa content to an existing HTML page I discovered that the RDFa was only defined for XHTML.<br>
><br>
> Now, we know there HTML parsers are quite tolerant and always try to make the best out of broken or not 100% valid markup.<br>
><br>
> My question is: Having a legacy HTML4 page, do I NEED to transform it into a valid XHTML page to be able to add GR markup as RDFa to it? Or just change the doctype and leave it up to the crawlers?<br>
><br>
> I went through some of the sources (Google etc.) but none of them explicitly stated the importance of a valid XHTML markup. Does anybody have any experience wrt this matter?<br>
><br>
> Thanks,<br>
><br>
> Laszlo<br>
</div></div><div><div></div><div class="h5">> _______________________________________________<br>
> goodrelations mailing list<br>
> <a href="mailto:goodrelations@ebusiness-unibw.org">goodrelations@ebusiness-unibw.org</a><br>
> <a href="http://ebusiness-unibw.org/cgi-bin/mailman/listinfo/goodrelations" target="_blank">http://ebusiness-unibw.org/cgi-bin/mailman/listinfo/goodrelations</a><br>
<br>
</div></div></blockquote></div><br>