UTF-8 化
このサイトをUTF-8にしたのは良いが、これから問題出そう。
このまま記事を入力し[投稿する]ボタンを押せば当サイトに送信されます。
以下の文章は注意書きです。
名前はかならず記入してください。ハンドルネームでも構いません。
またパスワードを入力することをお勧めします。
その場合他人による *なりすまし* と区別出来るかもしれません。
さらにブラウザでクッキーを有効に設定してある場合あなたの記事は後で修正可能になります。
コメントスパム防止のため記事の内容を機械的にモデレート
(スパムである確率を計算)
する処理を通します。
どのような投稿であれ、たまたま計算誤差によりスパムとみなされ
秘密の場所
に収納される可能性があります。
その場合、管理人が手作業で正規の場所に移動しますのでお待ちください。
-
33
owa
2004/01/20 21:53
id: mJs8kxp1Zus
prob: 0.0%
-
-
>>32 vocabulary.py
見ました dict にしてました。一方JCodeChanger ではファイルにしています。ZMI
レベルに限定すれば dict で持たせるのが簡単そうですね。
今考えているのが将棋プロダクトなんですが、たとえばルールの説明やチュートリアルくらいに分量が増えてくるとファイルにするのが良いのかと思ってます。
例えば EUC-JP でテキスト書けば一発で UTF-8 や Shift_JIS に変換できるし、english
で書けば仏独露西...と自動翻訳機にかけられるとか。
まだ先の話なので、おいおい調べていきます。vocabulary.py は流用するかもしれません。ありがとうございました。
-
32
kiyo
2004/01/20 10:45
id: M4qDt4tUHP2
prob: 0.0%
-
-
>>31
間違い、勘違いのたぐいの場合無視して下さい。
私(FZUG)が昔さわったプロダクトに Fle3 があります。
学習系に使われるプロダクトのようです。
これの Vocabulary.xx (「ボキャブラリィ」つづりがあやしい) だったと記憶しますが、
xx部分がそれぞれの言語に分かれて(例えば jpだと日本)いてこれを作る事で日本語表示が可能になってます。
plone にも似たしくみがあったような?
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/103...
から情報を探れます。
# ボキャブラリィ vocablaryでした。
# WebMailも同じですね。 これ少し日本語化する為いじったのが
http://fzug.com/fzug_prog/zopeing/d_load/TEST/WebMailJP-4.1....
にあります。
-
31
owa
2004/01/20 01:23
id: mJs8kxp1Zus
prob: 0.1%
-
-
Unix 系ではロケールと云う多言語化のしくみがありますが、Zope のプロダクト作る場合どんな方法があるのでしょう。この前の会合で質問したところ python, zope 系では標準的なしくみは無いらしいです。もしアイディア持っている方が
居られれば教えてください。
自分の作っているプロダクトのメッセージ文をどう扱おうか迷ってます。ボタンの切替えで多言語表示にしようと企てはいますが。JCodeChangerにも一部企てが入っていますが。
-
30
owa
2004/01/20 01:01
id: mJs8kxp1Zus
prob: 0.0%
-
-
>>29
script のマクロのような使いかたみたい?僕は使わないと思う。
この方面にとりくんでいればJZUGの価値があったのだろうけど。今や個人戦になっているようですね。といっても横のつながりが無いと云うわけではありませんが。
http://mail.zope.org/pipermail/zope-dev/2004-January/021420....
http://www.freeml.com/message/[email protected]/0000555
http://www.atransia.co.jp/home/fukamachi/Diary/2004/01/14/
...
兵士を助けるすべがない管理職は何をなすべきか。"文字昆布"かじるしか手は無いと云うのでは困った。もともとオープンソース・ソフトの世界に管理職なるものをもちこもうと云う発想には賛成しないので、今はあまり関わりたくありません。もちろんオープンな
管理システムは全然別で、望ましいと思ってますけど。
-
29
kiyo
2004/01/19 18:09
id: M4qDt4tUHP2
prob: 1.6%
-
-
最近 UTF-8 を意識している人が多くなったのだろうか?
http://mojix.org/2004/01/02/151950 を発見した。
-
28
owa
2003/12/18 21:00
id: mJs8kxp1Zus
prob: 0.2%
-
-
この BBS の投稿にフィルタが必要です
http://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/
http://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/bbs.cgi?c=...
UTFコードの仕様通りでないと、セキュリティ的にまずいらしい。
また UTF-8 以外で投稿することも可能ではあるので、作らねば。
以前に某 ZWiki サイトが文字化けでひどいことになったのを思い出します。
その時はなんでコードチェックしないのかと思いましたが、今日は我が身。
コードをチェックするついでに、いろいろチェックして見ようかな。
(追記: ↓の個人情報ポリシには変更ありません)
-
27
owa
2003/12/17 23:43
id: mJs8kxp1Zus
prob: 0.2%
-
-
さっき、このサイトの UTF-8 化実施しました。
不具合あるけど、ゆっくり直していきます^^
PostgreSQL のテーブル変換に psycopg ライブラリ使ったのですが、
昔 Oracle と C で組んだ頃を思い出すと涙出るくらい簡単。
なんかこの BBS も書き換えたくなってきたけど、それはまた別の話。
# せっかく頂いたコメント三件変換できませんでした。
# 後でハンドコピーしますので勘弁。
-
26
owa
2003/12/15 23:46
id: mJs8kxp1Zus
prob: 0.2%
-
-
さていよいよ RDB のコンバートなので下調べ
http://initd.org/software/initd/psycopg
http://www.python.jp/pub/doc_jp/contrib/peps/pep-0249.txt
http://www.postgresql.jp/document/pg734doc/index.html
python で RDB を自由に使えたらとてもうれしい。
ゆっくり急がずまいろうか^^
-
25
owa
2003/12/14 22:32
id: mJs8kxp1Zus
prob: 0.0%
-
-
サイトをコピーして全部 UTF-8 変換してみたけど、まあまあでした^^
問題が出たのは瓦版ページだけ。
- HTML ヘッダに文字コードを直に書くのは、Zope 的に良くない;;
- RDFSummary 直しが必要
EUC-JP と UTF-8 の両方に対応するには日本語の処理部分が多くなるので
別モジュールにしたほうが良さそう。元々コード変換は後付け機能だし。
- 某 EUC-JP サイトを UTF-8 変換するとエラーになる
文字列の最後が半端だと kconv がエラーを吐いて変換してくれません。
文字列カットとチェックメソッド作るので、それで対応する予定。
- 某 COREBlog サイトの RDF でエラーが出たけど、現在日記の先頭が文字化け
していて変、そのせいかもしれない。なので少し様子見。
- 某瓦版サイトでは先頭文字やサイズによるカットメソッド使ってますが、
処理を端折りすぎ。ちゃんと作らないといけません > 反省
-
24
owa
2003/12/14 00:14
id: mJs8kxp1Zus
prob: 0.0%
-
-
>>23
JCodeChanger-0.2.0 で ZCatalog ベースのオブジェクトにも対応しました。
ftp://owa.as.wakwak.ne.jp/pub/Zope/JCodeChanger
このプロダクトはツールなので、使う人におまかせと云うスタンスです。
ハサミを販売しても傷害幇助罪にはならないだろうと考えてます。
Squishdot, COREBlog 等の中のオブジェクトも変換できるので、
なんかの時には役立つかもしれません。
が、個別のプロダクトで設定している独自のプロパティ等があるので、
そのプロダクト自体をいじらないといけない場合が多いと思います。
日本語化 ZWiki の HTML ヘッダなどは直に埋め込まれていて、
テキストを変換した後、修正が必要のようでした。
自分のサイトの場合、何時移行しても対応できるようにヘッダに
---
<meta http-equiv="content-type"
content="text/html;charset=<dtml-var management_page_charset missing="euc-jp">">
---
などと入れてます
ところで pykf を選択した場合 utf-8 変換できない理由わかりました。
pykf は utf-8 への変換をサポートしていないので組込みの unicode を
使ってますが python 2.2 以降じゃないとだめみたいです。
ということで将来動くだろうとコーデック選択は残すことにしました。
と自分だけ納得して、ここまでで一応区切りにしますが、
障害等あれば連絡頂けると有り難いと思います。
追信: python で unicode モジュール使うには日本語の場合 JapaneseCodecs が必用です。python
の version のせいだと思ったのは私が無知でした。ちゃんと使えてます。失礼しました。
|