yahooのクローラー:Yahoo! DE Slurp
7/20ぐらいから、yahooのクローラーYahoo! Slurpに加えて、
Yahoo! DE Slurpなるクローラーがセットで毎日くるようになりました。
ただし、Yahoo! DE Slurpは、トップディレクトリーのみGETしているようでかつ、
Yahooの登録サイトのみ対象にしているように思われます。
Yahoo! Slurp Yahoo! DE Slurp Yahoo! Japan登録
www.picolix.jp ○ ○ ○ (ほぼ毎日)
sozai.picolix.jp ○ ○ ○ (ほぼ毎日)
dip.picolix.jp ○ × ×
search.picolix.jp ○ × ×
library.xrea.jp ○ × ×
管理サイト1.co.jp ○ ○ ○ (ほぼ毎日)
管理サイト2.co.jp ○ ○ ○ (4日に1回)
何の目的のクローラーか現在不明です。
LOGを調べてみたところ、7/16ぐらいに変更になったようです。
15:dj5000.inktomisearch.com – – [15/Jul/2004:05:29:07 +0900] “GET / HTTP/1.0
” 304 – “-” “Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/he
lp/us/ysearch/slurp)”
17:dj5000.inktomisearch.com – – [17/Jul/2004:05:18:27 +0900] “GET / HTTP/1.0
” 200 17953 “-” “Mozilla/5.0 (compatible; Yahoo! DE Slurp; http://help.yahoo
.com/help/us/ysearch/slurp)”
スタートアップの「dumprep 0-k」
windows xp ,msconfigツールで、スタートアップを眺めていたら、dumprepというみなれないものが走っていました。
エラーレポート機能らしいのですが、最近起動がやたらと遅いしなんか変。(個人設定のダイアログBOXがでてから3分はかかる。)
で、dumprepを外したら、さくっと起動するようになりました。
開発ツール等、どんどんインストールしてると、PCもどんどん起動が遅く、ソフトの動作も重くなってきます。
困ったもので、時々サービスプログラム、スタートアッププログラムなどいらないものは、ばっさり停止するようにしています。
月刊アスキーwebサイトオープン!
パーソナルコンピュータ総合誌・月刊ASCIIの月刊アスキーwebサイトオープン! しまた。(2004/7/16)
月刊アスキー8月号に、当ソフト3本載っていますが、そこからのURLリンクで、webサイトオープン
知りました。いつもは記載案内がくるのですが、今回は、ソフト記載連絡はなかったような気がします。
http://www.ascii.co.jp/pb/ascii/tool/content_07.html
http://www.ascii.co.jp/pb/ascii/tool/content_08.html
——————————————–
アスキー
yahooのクローラー:Yahoo! DE Slurp
いつも、来ているyahooのクローラーは、Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
ですが、Yahoo! Japanの登録サイト(2サイト)には、dj5000.inktomisearch.com – – [19/Jul/2004:05:03:54 +0900] “GET / HTTP/1.0” 200 20301 “-” “Mozilla/5.0 (compatible; Yahoo! DE Slurp; http://help.yahoo.com/help/us/ysearch/slurp)”
なのが来ていました。
4689 ヤフー関連企業
http://search.picolix.jp/search/4689.html
DMOZのカテゴリーデータ
Custom Dirで提供されていますディレクトリーサイト開発支援ツールを、ComSearchでカスタマイズして使わせてもらってますが、自分でも、いちから構築しようとやってみました。(現在、作成途中ですが、一度できれば、全自動で自分用に構築できるので。)
ディレクトリー構成は、Custom Dirで採用されている、カテゴリーIDでの階層表現を採用しました、というか、既に、Googleに993カテゴリー分インデックスされていますので、使用せざるをえないので。
それにしても、巨大なファイルです、解凍すると、1.77Gになります。秀丸で開けられません。。
1.content.rdf.u8.gz 283Mをダウンロードし、解凍すると、1.77G
チープなLinuxの自宅サーバで解凍したらディスク容量が足らず、no space。
windows xpのPC上で解凍した。
perlでプログラム。(windows xp上で実行)
1) 日本語階層だけを抽出 40M 120秒
韓国TV局SBS,KBSのディレクトリー検索
http://find.sbs.co.kr/../../…
http://find.kbs.co.kr/../../…
から、一番昔(1998/1ぐらい)に作ったサイトがリンクされていました。
調べてみると、”日本のウェブ”からカテゴリーをたどっていくと(ハングル語はまったくわからないので、NAVERでWEB翻訳)どうやら、過去にYahoo! Japanに登録していたサイト
http://web.kyoto-inet.or.jp/people/sho200/でした。
Yahoo! Japanのカテゴリーデータを利用しているみたいですが、データがどうも古いです。1年以上前だと思われます。
SBS,KBSとも同じ日本のWEBディレクトリーですが、どこが配信しているのでしょうか?
サイバーエージェント(東京マザーズ)ディレクトリ型コンテンツサイト WebVision
インターネット広告事業や金融サービスなどを提供する株式会社サイバーエージェントは12日、ディレクトリ型のコンテンツサイト「WebVision」をスタートした事を発表した。
[SEM/SEOニュース]
人生をより豊かに過ごすためのディレクトリ型コンテンツサイト
『WebVision』 http://www.webvision.jp/.をオープン
2004.7.12 pdf
なんか、All About Japanのサイトポリシーに似ているなと思ったらそうらしい。
[SEM/SEOニュース]
カテゴリーから、自分の見たいジャンルの記事をたどっていくのですが、検索機能が
ないので、途中であきらめてしまいます。(みつからない?)
——————————————–
4751 サイバーエージェント
http://search.picolix.jp/search/4751.html
白骨温泉の入浴剤問題
7/23~2泊3日で前々から、白骨温泉に旅行予定だったのですが、
例の白骨温泉の入浴剤問題でどうなることかと思っていたら、本日、宿泊先のホテルからお詫びのTELがありました。当ホテルでも入浴剤を使用しているとのこと。それでもきて頂ける方の為に、営業はしていますという内容でした。
ということでただ今思案中です。(<-奥さんが。)
ライブドア、ジェイ・リスティングを買収
インターネット関連サービスのライブドアは12日、インターネット広告のジェイ・リスティング(東京・渋谷、藤野真哉社長)を同日付で買収したと発表した。3億5000万円を投じて全株式を取得した。
[NIKKEI NET]
Jリスティング買収されたのですね。現在、BIGLOBE、exite系,DIONに有料ディレクトリーを
提供中です。
当サイト、www.picolix.jpも設立時から、無料で登録されていますが、昨日のログに以下の
ようなリファラーログがありました。
ttp://www2.jlisting.jp/system/rc/ch.php?done_id[]=134889&done_id[]=134892&done_id[]=134893&done_id[]=134896&done_id[]=134899&done_id[]=134900&done_id[]=134902&done_id[]=134903&done_id[]=134905&done_id[]=134906&from=38150&s=39&submit=確認完了、次へ
なんなの?と思っていたのですが。。
4753 ライブドア
http://search.picolix.jp/search/4753.html
プレゼン資料
久々に、プレゼン資料・概要書をパワーポイントで作成しました。
いつもは、ワード&visioでさくっと作成するのですが、エンドユーザ
より発注金額に見合う資料をということで、画像も含めて作りました。
以前だと、景気が悪くこういった話は皆無でしたが、たしかに景気は
良くなってきているような気がします。