ドリコムキャリア:求人情報に特化した検索エンジン

ドリコムキャリアは求人情報に特化した検索サイトです。
ロボットプログラムにより、インターネット上の求人情報や企業情報を自動で巡回・収集しています。
収集された情報は、職種や勤務地、フリーキーワードで検索することができます。[ドリコムキャリアホームページより]
同様なコンセプトで以前から、 株式会社ビジャストのジョブサーチがあります。
ドリコムキャリアの登録数は、現在55,826件
ジョブサーチの登録数は、現在53,324 件
とほぼ同様です。ちなみに自分の会社を検索して見ましたが、ヒットしませんでした、親会社の
会社名だと、ドリコムキャリアは2件、ジョブサーチは1件ヒットします。いずれも正しく該当企業の募集ページにリンクしてくれる優れものです。あとはロボットでデータをどれだけ多く、正しく収集できるかに、かかってくると思います。

サーチエンジン「SUZAKU(朱雀)」

Linuxのサーバー上で稼動するフリーのサーチエンジン「SUZAKU(朱雀)」バージョン2が公開されました。
1. SUZAKUとは
SUZAKU(朱雀) は、インターネット/イントラネットを対象にした、フリーの
ロボット型サーチエンジンです。
SUZAKU には、以下のような特徴があります。
・MySQL、Ruby、erubyなどのフリーソフトをベースにしたシステムです。
・SUZAKU は、以下の機能がワンセットになっています。
・ホームページのリンクを自動的に探索し、ダウンロード&インデックス化
 する機能
・キーワードに該当するホームページを検索する機能
・ブラウザによるシステムの管理機能
・ホームページのリンクの探索を、指定された同一サイト内に限定する機能
 があります。これにより、特定ジャンルのホームページ群を対象とした、
 独自のサーチエンジンを構築することができます。
・プラットフォームには、LinuxベースのPCサーバーを想定しています。高速
 検索が可能な MySQL をデータベースに使用しており、中小規模のサーチ
 エンジンであれば、十分に実用的なシステムを構築することができます。
例えば、ADSL + PCサーバー(Linux) + SUZAKU を使って、独自のサーチ
 エンジンを自前のサーバー上に構築し、外部に公開することができます。
・ホームページのダウンロード&インデックス化の処理を実行中でも、
 キーワードによる検索を行うことができます。
・ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけ
 ないようにする機能や、robots.txt による探索制限に従う機能を実装して
 います。
・プログラム本体は、Ruby および eruby で記述されており、ソースは公開
 されています。スクリプト言語による比較的コンパクトなシステムであり、
 改造も容易です。[linux-usersメーリングリストより。]
以前のバージョンを少し動かしたことがあるのですが、サイトデータ収集ロボットに
少し難があったので導入をあきらめていたのですが、今回久々にバージョンアップされたので再度検討してみようかと。。

グアム旅行

先週の木曜日(3/24)から日曜(3/27)まで,私、奥さん、娘(6歳)、、義母の4人でグアム旅行に行ってきました。
入国審査は、テロ事件の影響以来、厳しくなっており、指紋、デジカメ写真撮影など行われており、
ずいぶん時間がかかります。おまけに南国情緒なので処理もスローペースです。結局1時間半ぐらいかかりました。
レンターカーを借りて、グアム島内を観光したのですが、結局 娘は、車の中では、いつもお昼ね状態になるので、観光&買い物よりは、娘と私は、海かプールで泳ぐことになりました。


・私は、5年前から花粉症で今年が一番きついよなのですが、グアムではさすがに
 ぴたりとおさまりました。日本に戻ってきても、体がぼけているのか今のところ大丈夫です。

ウィキペディア辞書検索情報サイト

ウィキペディア辞書検索情報サイトMemoMsg立てました。
フリー百科事典『ウィキペディア(Wikipedia)』のデータ約10万語をmysqlデータベースに入れ、キーワードタイトル検索できるようにしました。
詳細内容は、wiki->html変換し10万ページ作成しました。(ベータ版)
(はたして、Googleに全てindexされるでしょうか?)
肝心の検索スピードは、部分検索で、0.5秒程度で検索できるので、サーバスペックから考えてまずまずです。
ちなみにpostgresにもデータを入れて比較してみましたが、。mysqlの方が格段に早いと思っていたのですが、ほとんど検索スピードは変わりませんでした。Oracleだと早いだろうか?


・キーワード配信できるようにする予定。

クレヨン

art1.gif
白紙に、いろいろな色のクレヨンで塗り、その上から黒のクレヨンで、一面をぬる。
その表面を、つまよう枝で引っかいて線画を描いたものがこれです。(作者は私&娘6歳です。)
娘が、幼稚園やってたというので、真似してみました。クレヨン・辞書

サーバダウンしてました。

さくら専用サーバ上で動作している、search.picolix.jp:午前02:30ぐらいから09:00ぐらいまで
ダウンしてました。さくらにTELしてサーバをリスタートしてもらいました。サーバ・辞書


telnet,ssh,ftp,mysql,postgres..などなどTCP/IPのポート全滅。しかしながら,Apacheのポート80だけは何故か生きていた。
xinetdだけ死んだのなら、telnet,ftp,ssh関連のみダウンするはずなのに、なぜにpostgres,mysqlまでも接続できないのか原因不明(?)でした。
各種のLOGにもエラーらしきものは一切なし、アタックの痕跡もないし、coreダンプも吐いていません。(謎です。)
何かのプロセスが沢山起動して、プロセス数の上限に引っかかったのだろうか??

バリューコマースとYahoo!Japanとの提携

>今回は、あくまでも資本提携を含む業務提携であり、バリューコマースの子会社
>化との 事実はなく、弊社の経営陣、事業ミッション、日常業務には一切の変更
>はございません。
>問題となりましたYahoo!JAPANの取得株については、2月28日時点での発行済み
>株式総数を用いた場合の割合であり、公開買付け期間中に新株予約権の行使が
>されますので、最終的には49.7%となります。
とのことでした。


バリューコマースは、www.picolix.jpで広告を張っているのですが、1年半かけてやっと、
5,000円に達しました。この前初めて入金された。