Namazu
[ はじめに ]
[ インストールと前提・RPMパッケージ編 ]
[ 設定・RPMパッケージ編 ]
mknmz -C
nmazu -C
mknmz -a -O /var/namazu/index/tako /home/tako/public_html
[ indexの作成・RPMパッケージ編 ]
1,/var/namazu/index内にtakoというディレクトリを作成。
1,パーミッションは755、所有者は「tako」。
1,.namazurcファイルでIndex /var/namazu/index/takoと指定しておくこと。
1,index作成コマンドは $mknmz -a -O /var/namazu/index/tako /home/tako/public_html(-Oは英字大文字のオー)
1,このコマンドの意味は、少々強引だが/home/tako/public_html下のすべてを対象に/var/namazu/index/tako内にindexを作成するということだろう。
[ Webからの利用・RPMパッケージ編 ]
<--
<li><input type="checkbox" name="idxname" value="foo">foo
<li><input type="checkbox" name="idxname" value="bar">bar
<li><input type="checkbox" name="idxname" value="bar">baz
-->
<li><input type="checkbox" name="idxname" value="tako">tako
<li><input type="checkbox" name="idxname" value="foo">foo
<li><input type="checkbox" name="idxname" value="bar">bar
<li><input type="checkbox" name="idxname" value="bar">baz
http://www.xxxx.ne.jp/~tako/cgi-bin/nanazu.cgi
<html>
<body>
<form method="GET" action="/cgi-bin/namazu.cgi">
<font size="2">
サイト内の検索は、空欄に検索文字を入れてクリックして下さい。全文検索システムは<br>
<strong><a href="http://www.namazu.org/">Namazu</a> v2.0.4</strong>です。<br>
<font size="+0">
<input type="TXST" name="key" size="40">
</font>
<input type="submit" name="submit" value=" 検索 ">
<input type="reset" name="reset" value=" reset ">
<input type="HIDDEN" name="whence" value="0">
<input type="checkbox" name="dbname" value="tako" checked>info
</font>
</form>
</body>
</html>
$ mknmz -a -O /var/namazu/index/tako /home/tako/public_html
「NMZ.hrad(NMZ.head.jp)にファイルの件数やインデックスの更新日が入っています。混乱を防ぐために、テンプレートととして使う場合は、この箇所を削除した方がよいでしょう」
現在、<!-- FILE --> 89 <!-- FILE --> の文書がインデックス化され、
<!-- KEY --> 9,169 <!-- KEY --> 個のキーワードが登録されています。
</p>
<p>
<strong>インデックスの最終更新日: <!-- DATE --> 2001-10-21 <!-- DATE --></strong>
-->
[ 追記 ]
[ Tips ]
[namazurcでする設定について]
## Replace /home/foo/public_html/ http://www.foobar.jp/~foo/
## Replace /home/(.*)/public_html/ http://www.foobar.jp/\1/
## Replace /C\|/foo/ http://www.foobar.jp/
##
## If you do not want to do the processing on command line use,
## run namazu with -U option.
##
Replace /home/tako/public_html http://www.xxxx.ne.jp/~tako/
Replace /home/(.*)/public_html/ http://www.foobar.jp/~\1/
#Replace /home/foo/public_html/ http://www.foo.bar.jp/~foo/
[ 参考図書・URL ]
|
[ indexの更新 ](2002.04.02)
/usr/bin/mknmz -a -O /var/namazu/index/tako /home/tako/public_html (-Oは英字大文字のオー)
[ 追記 ](2006.04.04)
#!/bin/sh
export LANG=ja_JP.eucJP
export PEAL_BADLANG=0
mknmz -a -O /var/namazu/index/tako /home/tako/public_html --exclude="(pass|data|xxxx|cgi-bin)" >> /var/log/mknmz.log
[ 追記 ](2006.04.18)
/var/log/mknmz.log {
weekly
notifempty
missingok
create 0600 root
rotate 4
}
[ 失敗例mail ]
mknmz 2.0.4, an indexer of Namazu. Usage: mknmz [options] <target>... Target files: -a, --all target all files. -t, --media-type=MTYPE set the media type for all target files to MTYPE. -h, --mailnews same as --media-type='message/rfc822' --mhonarc same as --media-type='text/html; x-type=mhonarc' -F, --target-list=FILE load FILE which contains a list of target files. --allow=PATTERN set PATTERN for file names which should be allowed. --deny=PATTERN set PATTERN for file names which should be denied. --exclude=PATTERN set PATTERN for pathnames which should be excluded. -e, --robots exclude HTML files containing <meta name="ROBOTS" content="NOINDEX"> -M, --meta handle HTML meta tags for field-specified search. -r, --replace=CODE set CODE for replacing URI. --html-split split an HTML file with <a name="..."> anchors. --mtime=NUM limit by mtime just like find(1)'s -mtime option. e.g., -50 for recent 50 days, +50 for older than 50. Morphological Analysis: -c, --use-chasen use ChaSen for analyzing Japanese. -k, --use-kakasi use KAKASI for analyzing Japanese. -m, --use-chasen-noun use ChaSen for extracting only nouns. Text Operations: -E, --no-edge-symbol remove symbols on edge of word. -G, --no-okurigana remove Okurigana in word. -H, --no-hiragana ignore words consist of Hiragana only. -K, --no-symbol remove symbols. Summarization: -U, --no-encode-uri do not encode URI. -x, --no-heading-summary do not make summary with HTML's headings. Index Construction: --update=INDEX set INDEX for updating. -Y, --no-delete do not detect removed documents. -Z, --no-update do not detect update and deleted documents. Miscellaneous: -s, --checkpoint turn on the checkpoint mechanism. -C, --show-config show the current configuration. -f, --config=FILE use FILE as a config file. -I, --include=FILE include your customization FILE. -O, --output-dir=DIR set DIR to output the index. -T, --template-dir=DIR set DIR having NMZ.{head,foot,body}.*. -q, --quiet suppress status messages during execution. -v, --version show the version of namazu and exit. -V, --verbose be verbose. --debug be debug mode. --help show this help and exit. Report bugs to <bug-namazu@namazu.org>.
[ 成功例mail ]
10 files are found to be indexed. 1/10 - /home/tako/public_html/tako/xxxxx /d_ether/ETHER.EBK may be a BINARY file! skipped. 1/9 - /home/tako/public_html/tako/xxxxx /d_ether/Ether.sea may be a BINARY file! skipped. 1/8 - /home/tako/public_html/tako/xxxxx /d_ether/Ether.zip Unsupported media type (application/x-zip) skipped. 1/7 - /home/tako/public_html/tako/xxxxx /d_ether/FINDER.DAT may be a BINARY file! skipped. 1/6 - /home/tako/public_html/tako/xxxxx /d_ether/img/FINDER.DAT may be a BINARY file! skipped. 1/5 - /home/tako/public_html/tako /index.html.flc Unsupported media type (application/x-elc) skipped. 1/4 - /home/tako/public_html/tako /top/%252fAppleDouble/%252fParent may be a BINARY file! skipped. 1/3 - /home/tako/public_html/cgi-bin/namazu.cgi may be a BINARY file! skipped. 1/2 - /home/tako/public_html/data/doun.exe may be a BINARY file! skipped. 1/1 - /home/tako/public_html/data/odic.data01.exe may be a BINARY file! skipped. [Append] Date: Tue Apr 2 0x:0x:03 2xx2 Total Documents: 4x8 Total Keywords: 4x,xx1 Wakati: module_kakasi -ieuc -oeuc -w Time (sec): 2 File/Sec: 0.00 System: linux Perl: 5.xxxx3 Namazu: 2.0.4 (02.02.01)
[ Turbolinux 8 Server・RPMパッケージ編 ]
ftp://ftp.turbolinux.co.jp/pub/TurboLinux/TurboLinux/ia32/Workstation/8/install/
|
[ クライアントごとの全文検索Namazu ]
# cp /etc/namazu/namazurc /home/ユーザ/.namazurc
# cp /etc/namazu/namazurc /home/ユーザ/.mknmzrc
$ mkdir /home/ユーザ/mynamazu
$ namazu -f /home/ユーザ/.namazurc -C
$ cd public_html
$ mkdir cgi-bin
$ cp /home/ユーザ/.namazurc /home/ユーザ/public_html/cgi-bin
# cp /var/www/cgi-bin/namazu.cgi /home/ユーザ/public_html/cgi-bin
$ mknmz -a -O /home/ユーザ/mynamazu /home/ユーザ/public_html
$ cd /home/ユーザ/mynamazu
$ cat NMZ.head.ja NMZ.body.ja NMZ.foot.ja > /home/ユーザ/public_html/search.html
Index /home/ユーザ/mynamazu
Replace /home/ユーザ/public_html http://www.xxxx.ne.jp/~ユーザ/
(文責・k)
topへ home:topへ server library:topへ