« OPEN ACCESS | 最新のページに戻る | MovableType3.11導入メモ »

■ ジャーナルのfull textに<SUP>タグが入っている

ということで最近Designing with Web Standards―XHTML+CSSを中心とした「Web標準」によるデザインの実践 Designing with Web Standards―XHTML+CSSを中心とした「Web標準」によるデザインの実践とかweb designingの記事とかを読んでCSSとかweb標準とかにかぶれているのですが、firefoxに変えて一つ発見をしたんで報告。
JNSのfull textを開いてみたらslepnirで見ていたときと比べてなんか行間が広いんです。おかしいなと思ってhtmlソースを見たら、テキストに60文字ごとに<SUP> </SUP>とか入ってるんです*1。Fulltextのページでctrl-Aしたら一目瞭然でした。どうやらこの<SUP>タグでどのくらい文字を上にずらすかがinternet explorerとfirefoxとで違っているようなのですね。たぶんこのタグを使って行間を広めにしようとしてるんでしょうけど、ひどい技ですよね。たとえばブラウザの横幅小さくして30文字くらいしか見れないようにするとこのタグが入っている行と入っていない行とで行間がぜんぜん違って見えるわけです。しかもこのサイトはCSSを使っていないわけではなくて、論文のファイルごとに頭に埋め込んであるのです。だったら、line-heightで設定してやればよいではないですか。line-heightがInternet explorer 3ではバグるから回避した、とはちょっと思えません。しかもこんなことされるとhtmlファイルでフレーズ検索するときに<SUP>タグに引っかかって検索に失敗するということも起こるわけです。どうもテキストを溜め込んでデータとして活用する可能性というものをまったく考えてないのではないか、と思う次第です。本文と図のレジェンドの関係とか、もっと構造的にして再利用できるようにしてちゃんとXML的にですね……(<-かぶれ過ぎ)。
そういえばかつて論文のfull textのhtmlを貯めこんで全部つなげてコンコーダンサ用のコーパスを作れば論文を書くときに便利なのではないかと考えたことがあるのですが(いつもこういうことを考えるだけで実践しない私)、こういう変な技をしている例があることをよく確認しておいたほうがよいのでしょう。やるとしたら日本人含むnonnativeが書いた論文をはねるとかいくつかの前処理をしておかないと使いものにならないだろうし(ま、自分のことは置いといて)。
追記:こんなヌルいことを書いていたらNatureではすでに2001年の段階でThe Public Library of Scienceとの兼ね合いなどで"Future e-access to the primary literature"というdebateサイトを作ってXMLの可能性とかについてもextensiveに議論した形跡がアーカイブしているのでメモメモ。下のほうへいくとRichard StallmanやTim O'Reillyも書いてる。こんなのがあるとは知らなかった。とはいえ、最近はこのhttp://www.nature.com/nature/debates/は活用されていない様子だけれど。


*1:PNASやScienceなどもそうなってました(pdfのautomatic downloadをする画面を見るかぎり同じ所がweb製作を手がけているのでしょう)。Natureはそうなりませんし、ScienceDirectからダウンロードするところはみんなそうなってません。


お勧めエントリ


月別過去ログ