とあるホームページが表示されないので、Googleのキャッシュ表示を利用したのですが、
キャッシュ日付けが、GMT 1969/12/31 23:59:59になってました。
UNIX時間なら、1970/1/1 00:00:00が起点だけど、どうして1秒前なんでしょうか?
ちなみに、日本最初のホームページは、
1992/9/30で、http://www.ibarakiken.gr.jp/www/です。
管理人Library最初のホームページは、1998/1/8です。
まあ↑でもYahoo Japanに登録されていました。現在は、www.picolix.jpに引き継いでいます。
アメリカ最初のホームページ、残念ながら不明です。
url2bmpで10,000サイトのWEBサムネイル画像GET!
url2bmpを使って、アートカテゴリー(http://sozai.picolix.jp/dmoz/)の登録サイト10,000のトップページのサムネイル画像を12時間かかって取得しました。。
当初は、thumbshots.orgを使っていたのですが、相手サーバが過負荷状態だとなかなかデータを取得できず、ページを表示するのにロック状態となってしまっていました。
ということで、自分でサムネイル画像を保存しておくしかないということで、ちょうどurl2bmpを見つけました。url2bmpはコマンドラインから実行できるので、perlでスクリプトを組んでみたのですが、時々
JAVASCRIPTエラーしたページがあるとそこでロック状態となってしまい次に進めません。
そこで、vcでスレッドを作って、そこからCreateProcessで、url2bmpを呼び出し、1分のタイムアウト
処理で、url2bmpをスレッドごと強制終了させるようにした。
->で、流すこと12時間10、000サイトの画像が取得できた。
で、結果はご覧のとおりです。http://sozai.picolix.jp/dmoz/77596/902594/1127321/
※ url2bmpは、アクセス先にポップアップウィンドウがあると、別窓で表示します。
したがって、10,000サイトもアクセスすると、画面がポップアップウィンドウやら認証ページやら
JAVASCRPITの入力ウィンドウで埋め尽くされます。(笑う)
こういう場合は、kill iexplore でばっさり落とします。
url2bmpでは、画像を1対1のサイズで保存する時は、右のスクロールバーを保存なしに
できるのですが、それ以外だと、右のスクロールバーなし設定にもかかわらず表示されてしみます。(バグ?)
しょうがないので、800×600をそのまま保存して、ShukuSen.exeにて120×90に縮小しました。
ShukuSen.exeもコマンドラインにて動作できるので、これもスクリプトに組み入れました。
さくらの専用サーバのメモリ容量
さくらの専用サーバのメモリ容量は、仕様を見ると メモリは、256MBですが、
Linux上でdmesgで確認すると、222MBしかありません。残り32MBはどこに
いったのか??
サポセンに問い合わせると、
ハードウェア部品として、オンボードタイプ
のビデオチップを使用しており、BIOSが起動すると32MB程度のメモリ領域をOSへ
渡す前に予約いたします。
とのこと、ビデオチップにオンメモリー上のメモリーが32MBも割り当てられています。そんなあ~。
本体メモリの1割以上もです。仕様にこのあたりも記載して頂きたいです。
なんか損した気分ですし、プロセスの使用メモリー設計にも関わってきます。
三菱電機、量子暗号通信に成功・通信距離は世界最長
三菱電機、量子暗号通信に成功・通信距離は世界最長
菱電機は29日、盗聴や改ざんを完全に防げるといわれる「量子暗号通信」で、国内初の屋外通信実験に成功したと発表した。通信距離は世界最長の96キロメートル。量子暗号通信が実用レベルに達したことを実証できたという。2年後をメドに官公庁のセキュリティーシステムなどで実用化を目指す。
実験には大阪市と京都府精華町を結ぶ情報通信研究機構の既設回線を利用した。通信速度は毎秒8.2ビット。文字情報を既存技術で暗合化。暗号を解くための「鍵」を量子暗号通信の手法で送った。鍵が盗聴不能なので、情報自体も安全に送ることができるという。[NIKKEI]
通信速度は、8.2ビット/secですか。。昔、50ビット/secのアナログ通信をしたことがありますが、
これぐらいの速度になると、クリスタルイアホーンで、慣れるとデータを識別できます。
でも、今回は、光子による通信で、この光子を覗き見すると、光子自体が変化(?)するらしく
結果、盗聴できないというものらしい。
6503 三菱電機(株) http://search.picolix.jp/search/6503.html
英国版SEOコンテストのゴッゴル
”無コムのブログ”さんのところで、海外サイト
http://www.salmonbones.co.uk/でゴッゴルがサインされているのが紹介されていました。、
ソースをみると、charset=windows-1252ですが、UNICODE(utf-8)で&#で記述されています。
なるほど、多言語を少し混ぜこぜに散りばめたいときはそうするのか。。
ゴッゴルは10進表記で、
ゴッゴル
16進表記で、
ゴッゴルとなります。
ついでに、管理人作の文字コード表示ツール紹介しておきます。
http://dip.picolix.jp/disp.html#winjis
さて、前回、ゴッゴルを書いてみましたが、検索順位はさっぱりでした、200~300位
ぐらいで今は、どこにあるかさえ分かりません。
企業検索エンジンComSearchサーバ移転
企業検索エンジンComSearchサーバ移転完了しました。
従来、XREAのフリースペース+広告なしで運用してきましたが、今回さくらの専用サーバに移転しました。
サーバのスペック的には、XREAのフリースペースの方が上で、Postgresの検索スピードも、
さくらの専用サーバより倍は早いです。しかしながらさくらの専用サーバは共用サーバではないので、
ネットワークトラフィックは別として、安定して検索結果が得られます。
リリース2納品&本番運用
某大手研究所向け案件の、ある管理システムのリリース2を納品、
要望修正&バグ修正後、本番運用開始1週間たちました。
クレームなしで、連続稼動しているようです。
(ひと安心です。これで本年の一番大きなプロジェクトは終了か?)
BLOG開設1周年
このBLOGを立ち上げてはや1周年となりました。当初はlibrary.xrea.jpで
運営していましたが、この度は、www.picolix.jp/blogとして運営していくことになりました。
(本日、年末ジャンボ宝くじ10枚購入しました。当ったら。!?・*/)
さくらの専用サーバ(6,800/月)の性能
さくらの専用サーバ、
CPU Efficeon1.0GHz,メモリ 256MB,HDD容量 20GB,ネットワーク 100Base-TX接続
に、現在、本ブログと検索サイトhttp://search.picolix.com/dmozを構築していますが、
XREAの共用の無料WEBサーバと処理速度(体感)を比較すると、XREAの共用の無料WEBサーバ
の方がcgi,postgres,apacheは早いです。
ただ、共用の無料WEBサーバだと安定していつも早いわけではなく、遅いときはとんでもなく
遅くなります。
検索結果の比較(ネットワークのトラフィックが無関係、DBのアクセス時間です。)
XREA上の無料WEBサーバ:
http://search.picolix.jp/dmoz/index.php?s_keyword_in=%BE%F0%CA%F3
検索結果 0.42秒 (但し負荷が高い時は、平気で数秒かかりまし、無応答になることもしばしば。。)
さくらの専用サーバ:
http://search.picolix.com/dmoz/index.php?s_keyword_in=%BE%F0%CA%F3検索結果 0.97秒
で、2倍以上さくらの専用サーバがかかってますが、まあそれほど問題ないでしょう。
専用ですので、共用のようにリソースが圧迫されることもありませんし、安定稼動が確認できたら、
この専用サーバに、本体www.picolix.jpともども移転予定です。
さくらの専用サーバにBLOG移転
さくらの専用サーバにBLOG移転、エントリーテスト。
mysqlデータ exportしてもってきました。