サーチエンジン「SUZAKU(朱雀)」

Linuxのサーバー上で稼動するフリーのサーチエンジン「SUZAKU(朱雀)」バージョン2が公開されました。
1. SUZAKUとは
SUZAKU(朱雀) は、インターネット/イントラネットを対象にした、フリーの
ロボット型サーチエンジンです。
SUZAKU には、以下のような特徴があります。
・MySQL、Ruby、erubyなどのフリーソフトをベースにしたシステムです。
・SUZAKU は、以下の機能がワンセットになっています。
・ホームページのリンクを自動的に探索し、ダウンロード&インデックス化
 する機能
・キーワードに該当するホームページを検索する機能
・ブラウザによるシステムの管理機能
・ホームページのリンクの探索を、指定された同一サイト内に限定する機能
 があります。これにより、特定ジャンルのホームページ群を対象とした、
 独自のサーチエンジンを構築することができます。
・プラットフォームには、LinuxベースのPCサーバーを想定しています。高速
 検索が可能な MySQL をデータベースに使用しており、中小規模のサーチ
 エンジンであれば、十分に実用的なシステムを構築することができます。
例えば、ADSL + PCサーバー(Linux) + SUZAKU を使って、独自のサーチ
 エンジンを自前のサーバー上に構築し、外部に公開することができます。
・ホームページのダウンロード&インデックス化の処理を実行中でも、
 キーワードによる検索を行うことができます。
・ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけ
 ないようにする機能や、robots.txt による探索制限に従う機能を実装して
 います。
・プログラム本体は、Ruby および eruby で記述されており、ソースは公開
 されています。スクリプト言語による比較的コンパクトなシステムであり、
 改造も容易です。[linux-usersメーリングリストより。]
以前のバージョンを少し動かしたことがあるのですが、サイトデータ収集ロボットに
少し難があったので導入をあきらめていたのですが、今回久々にバージョンアップされたので再度検討してみようかと。。

グアム旅行

先週の木曜日(3/24)から日曜(3/27)まで,私、奥さん、娘(6歳)、、義母の4人でグアム旅行に行ってきました。
入国審査は、テロ事件の影響以来、厳しくなっており、指紋、デジカメ写真撮影など行われており、
ずいぶん時間がかかります。おまけに南国情緒なので処理もスローペースです。結局1時間半ぐらいかかりました。
レンターカーを借りて、グアム島内を観光したのですが、結局 娘は、車の中では、いつもお昼ね状態になるので、観光&買い物よりは、娘と私は、海かプールで泳ぐことになりました。


・私は、5年前から花粉症で今年が一番きついよなのですが、グアムではさすがに
 ぴたりとおさまりました。日本に戻ってきても、体がぼけているのか今のところ大丈夫です。

ウィキペディア辞書検索情報サイト

ウィキペディア辞書検索情報サイトMemoMsg立てました。
フリー百科事典『ウィキペディア(Wikipedia)』のデータ約10万語をmysqlデータベースに入れ、キーワードタイトル検索できるようにしました。
詳細内容は、wiki->html変換し10万ページ作成しました。(ベータ版)
(はたして、Googleに全てindexされるでしょうか?)
肝心の検索スピードは、部分検索で、0.5秒程度で検索できるので、サーバスペックから考えてまずまずです。
ちなみにpostgresにもデータを入れて比較してみましたが、。mysqlの方が格段に早いと思っていたのですが、ほとんど検索スピードは変わりませんでした。Oracleだと早いだろうか?


・キーワード配信できるようにする予定。

クレヨン

art1.gif
白紙に、いろいろな色のクレヨンで塗り、その上から黒のクレヨンで、一面をぬる。
その表面を、つまよう枝で引っかいて線画を描いたものがこれです。(作者は私&娘6歳です。)
娘が、幼稚園やってたというので、真似してみました。クレヨン・辞書

サーバダウンしてました。

さくら専用サーバ上で動作している、search.picolix.jp:午前02:30ぐらいから09:00ぐらいまで
ダウンしてました。さくらにTELしてサーバをリスタートしてもらいました。サーバ・辞書


telnet,ssh,ftp,mysql,postgres..などなどTCP/IPのポート全滅。しかしながら,Apacheのポート80だけは何故か生きていた。
xinetdだけ死んだのなら、telnet,ftp,ssh関連のみダウンするはずなのに、なぜにpostgres,mysqlまでも接続できないのか原因不明(?)でした。
各種のLOGにもエラーらしきものは一切なし、アタックの痕跡もないし、coreダンプも吐いていません。(謎です。)
何かのプロセスが沢山起動して、プロセス数の上限に引っかかったのだろうか??

バリューコマースとYahoo!Japanとの提携

>今回は、あくまでも資本提携を含む業務提携であり、バリューコマースの子会社
>化との 事実はなく、弊社の経営陣、事業ミッション、日常業務には一切の変更
>はございません。
>問題となりましたYahoo!JAPANの取得株については、2月28日時点での発行済み
>株式総数を用いた場合の割合であり、公開買付け期間中に新株予約権の行使が
>されますので、最終的には49.7%となります。
とのことでした。


バリューコマースは、www.picolix.jpで広告を張っているのですが、1年半かけてやっと、
5,000円に達しました。この前初めて入金された。

smail 10,000ダウンロードありがとうございました

SMAIL 10,000ダウンロードありがとうございました。
http://dip.picolix.jp/page3.html
(このうち0.?%は、ロボットによるアクセスですが。。)
SMAILは、送信専用のコマンドラインメールで、各種の認証に対応しています。
またSMTPS/POPS(SMTP/POP over SSL) にも最近対応致しました。


SMAILのSSL暗号化は、OPENSLLを使用しています。
OPENSSLは、libを作成して組み込んでいます。
[メモ]
openssl ライブラリー作成方法(Windows 2000,xp)
(事前にactive perlが必要ですので、インストールしておく)
http://www.openssl.org/より、openssl-x.x.x.tar.gzをダウンロードして展開する。
DOS窓で、
c:>perl Configure VC-WIN32
c:>msdo_ms.bat
msnt.makが生成されるので、以下のようにCFLAGを変更する。
CFLAG= /MD /W3 /WX /G5 /Ox /O2 /Ob2 /Gs0 /GF /Gy
/nologo -DOPENSSL_SYSNAME_WIN32 -DWIN32_LEAN_AND_MEAN
-DL_ENDIAN -DDSO_WIN32 /Fdout32 -DOPENSSL_NO_KRB5
->
CFLAG= /ML /W3 /GX /O2 /nologo -DOPENSSL_SYSNAME_WIN32
-DWIN32_LEAN_AND_MEAN -DL_ENDIAN -DDSO_WIN32 /Fdout32
-DOPENSSL_NO_KRB5
c:>nmake -f msnt.mak
で、outディレクトリーに、libeay32.libとssleay32.libが生成されます。これを組み込めばDLLの必要は無し。
(DLLを作りたい時は、nmake -f msntdll.makを実行する。)
[メモ2]
/ML, /MLdオプション VC++ のシングルスレッド用ライブラリを使用。
/MT, /MTdオプション VC++ のマルチスレッド用ライブラリを使用。
/MD, /MDdオプション VC++ のマルチスレッド用DLLを使用。
(実行時にVC++用のDLLが必要。)

Becky!用スパムメールフィルタ Annex

スパムメールが、もう我慢できないくらい多くなってきたので、愛用のBecky!でスパムフィルタのプラグインを探していたのですが、軽くていいのが見つかりました。
Becky!用スパムメールフィルタAnnex


Becky!のスパムメールフィルターでは、BkASPilが定番ですが、これは
特別に、スパムメールの管理サーバと定期的に通信する必要があり、常時インターネットに
接続していなければならず、負荷がかかります。また、メールサーバ以外のサーバと常時ハンドリング
するのもいやです。ぜひデータ、定義ファイル等はダウンロード方式にしてもらいたいものです。
ということで今は、Annexを使っており、順調にスパムメールを専用のゴミ箱に入ってます。

マラソン大会 by 幼稚園

娘の幼稚園で先日、年長組のマラソン大会がありました。
隣接の高校を一周(約1Km)するものですが、うちの娘は梅組の女子で4位で戻ってきました。。大穴です。。
先生もびっくり、娘を良く知っているお母様方もびっくりということでした。


私の娘は、運動よりも、お絵かき、工作などの方が大好きで外で遊ぶよりも家の中で遊ぶのが好きなようです。
まあ、通っている幼稚園は今時ですが、いろいろとスパルタな幼稚園でして、娘にはちょうど良いのではと思ったりもしています。