【Fess】5分で構築!全文検索サーバ【専用スレ】

1Fess2014/02/18(火) 01:09:31.31ID:TuEYQrKl
Fessは全文検索のJavaアプリケーションサーバです。
インストールから起動までが5分もかからずに検索サーバを構築することができます。
OS非依存でJavaの実行環境があれば利用可能です。

Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

(旧ページ)http://fess.sourceforge.jp/ja/index.html
(新ページ)http://fess.codelibs.org/ja/


<最新バージョンダウンロード>
http://fess.codelibs.org/ja/downloads.html

なかったので作りました。
ユーザーさん!語らいの場所としませう。

2login:Penguin2014/02/18(火) 07:10:42.92ID:k9q+Q5uA
落ちないか心配なので2

3login:Penguin2014/02/18(火) 14:58:03.56ID:L4L0RMMT
elasticsearch と比較してどうなの?

4login:Penguin2014/02/18(火) 17:20:15.70ID:w9L1ruYh
w

5login:Penguin2014/02/18(火) 19:34:02.48ID:TuEYQrKl
>>3
日本語に対応。5分でできることか。

6login:Penguin2014/02/18(火) 19:37:38.58ID:tvLRNv1w
検索エンジンはJAVAなの?

7login:Penguin2014/02/19(水) 20:02:09.81ID:PXrp0UA1
>>6
つ >検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。

8login:Penguin2014/02/19(水) 20:11:04.96ID:wCfvPVsx
>>7
つまりJAVAなのか。
JAVAいれないとイカンのかー嫌だなあ

9login:Penguin2014/02/19(水) 21:57:15.37ID:E0ScXIs3
今から帰るのでその後軽く触ってみようと思ってるけど、Fessって solr のフロントエンドみたいなの?
それとも、それらも含めたパッケージってこと?

10login:Penguin2014/02/19(水) 22:07:26.10ID:E0ScXIs3
あ、勘違いしてた。
solr をdb として動くwebアプリケーションって感じか

elasticsearch と比較とかトンチンカンだったな。すまん

11login:Penguin2014/02/20(木) 00:03:30.94ID:ZidauIr6
>>8
サーバ用JREなら邪魔なプラグインとか入らないぞ
32bit用はないけどな

12login:Penguin2014/02/20(木) 01:49:13.23ID:qJ5W4xZq
>>8
JAVAなんて、centosのデスクトップ版だったら、最初から入っていたよ

13login:Penguin2014/02/20(木) 01:51:16.57ID:qJ5W4xZq
>>10
>ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
>MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

S2Robotがなんかよく知らないけど、このへんがすごそうでしょ
googleロボットのようなものだと理解している。

14login:Penguin2014/02/21(金) 10:49:04.93ID:4JjEExTM
JAVAって時点でイラネ

15login:Penguin2014/02/21(金) 13:09:11.16ID:kYL4Kz4u
シッタカほどそう言うね

16login:Penguin2014/02/24(月) 06:04:17.02ID:pF0tvCHx
age

17login:Penguin2014/02/25(火) 02:22:54.32ID:qqzTNRIm
>>14
javaが検索処理するわけではないようだよ
あくまでフロントエンドのWEBアプリがJAVAで書かれているってことじゃないの?
WEBアプリだったら、JAVA以外になにを使いたいっての?

18login:Penguin2014/02/25(火) 08:53:43.40ID:pylh68Lc
無知は黙ればいいと思うよ

19login:Penguin2014/02/26(水) 07:57:45.29ID:xfsdUR/1
Solrがエンジンて書いてあるからJavaベースだろ。

20login:Penguin2014/02/26(水) 09:09:57.04ID:4VNT7tqy
Solrは、JAVAで書かれているのか?

21login:Penguin2014/02/26(水) 10:57:13.26ID:/+fsmmiT
訊く前に自分で調べてみないヤツはいつまで経ってもアホのまま

22login:Penguin2014/02/27(木) 08:16:51.28ID:BtwaOiyQ
試しに使おうと思うんですが、空きメモリって512MBほどあれば十分でしょうか。

23login:Penguin2014/03/08(土) 15:46:27.85ID:zLZACqEZ
試してみればいいだろ

24age2014/05/08(木) 20:31:34.46ID:aKBoMILe
raise this up

25login:Penguin2014/05/24(土) 01:05:51.32ID:OMaMNgDg
いいよこれ

26login:Penguin2014/05/28(水) 03:51:04.45ID:FnLmjL/R
質問いいでしょうか。

Fess 9.1.0を、CentOS 6.5 64bitにインストールして、
./startup.shを起動したのですが、ブラウザからlocalhost:8080/fessへアクセスできません。

jdkは、yum install java-1.7.0-openjdk* で入っています。

環境変数は、
# echo ${JAVA_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
# echo ${JRE_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64

となっています。

ip6tables iptablesは無効になっています。

結構いろいろ試行錯誤して、粘りましたが、お手上げです。
5分どころか、4時間もかかってもできません・・・疲れた。

27login:Penguin2014/05/28(水) 03:51:49.11ID:FnLmjL/R
質問↑
age させてください。

28login:Penguin2014/07/14(月) 01:35:23.16ID:ZbPu+eyy
>>26
こっちはFess9.2.0 serverをCentOS6.5 32bitに入れてみたが、ダメだな。Tomcatが動かん。
試しに、Fessに入ってるのと同じverのTomcat7.0.54を別に入れてみたらデフォルトでTomcatの起動だけはうまくいった。
だから26もTomcatに対するjdkのパスの通し方は問題ないと思うよ。

http://fess.sourceforge.jp/ja/4.0/config/install-on-tomcat.html
こんなページも見つけて試してみたけど、やっぱりTomcatがそもそも起動しなくなる。
fessとopenjdkの組み合わせがダメなのか、別な何かがダメなのかわからん。オレは趣味でやってみただけだから諦めたよ。

29login:Penguin2014/07/23(水) 02:34:41.76ID:uh+cSX8+
Fess9.2.0をScientific Linux 6のマシンにインストールして使ってます
ジョブとクローラの関係について理解したいので、教えてください

現在は試験運用として、過去の古いファイルを置いてるファイルサーバをクロールさせて
インデックスを作っています
クロールには、差分クロールを有効にしても数時間かかること、また格納されてるファイルは
更新されないことから、「Crawler」ジョブを無効にしています
(ファイルシステムクロールとCrawlerジョブがどこで関連づけられてるのか分かってないのですが)

このマシンで、新たに最新のファイルを置いてるファイルサーバを、こちらは定期的に
クロールさせたいと思ってます

とりあえず、ファイルシステムクロールで2つめの設定を加えたのですが、ジョブで
・古いファイルはクロールさせない
・最新のファイルは週に一度クロールさせる
という設定をするためには、どういう設定を施せばよいのでしょうか

公式サイト等みてるのですが、どうにも糸口がつかめず

30login:Penguin2014/11/10(月) 16:13:53.79ID:ssEKguwc
Fess 9.3.0だけど、ファイルシステムクロールでzip(書庫)の展開を無効化するにはどうしたらええのん?

31login:Penguin2014/11/10(月) 17:14:03.01ID:MJiRF7py
通常ファイルにして書庫に入れない

32login:Penguin2014/11/15(土) 11:48:48.11ID:oZ6QSUo5
ファイルの中身を見ないでファイル名だけでインデックス作成したいんだけど、どうもできなさそうね。

33login:Penguin2014/11/25(火) 02:04:47.97ID:94ngxVaV
fess、人気が出てきたな。
メーリングリストからメールが結構回ってくる。

34login:Penguin2015/01/05(月) 10:59:52.53ID:y2Z3MYI8
age

35login:Penguin2015/02/21(土) 12:17:11.83ID:S9F0w3qg
CvsDataStoreの解説まだかなー

36ブロンチョ2015/05/04(月) 00:38:44.00ID:WBQqPO1n
メールディレクトリのメッセージをすべてsolrに登録して
imap searchコマンドでメール本文を全文検索させたいんご
検証環境つくるかな
dnsとsquidとwikiとbackupサーバとldapとftpとフロントエンドWebサーバのリプレイスの後に
ニヤリ

37login:Penguin2015/06/23(火) 12:05:56.92ID:ks5pbfUO
UniJISだかAdobe Japanだか言う文字コードのPDFが化け化けでクロールできない
仕様?

ttp://sourceforge.net/p/pdfbox/bugs/_discuss/thread/66f3c682/1353/attachment/UniJIS-UCS2-HW-H_sample.pdf

38login:Penguin2017/06/16(金) 14:11:25.56ID:SDXyAFC+
鉄板の検索エンジンってあるの?

39login:Penguin2017/12/29(金) 16:19:52.29ID:S/CsVkMC
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

9BJF3O5E8R

40login:Penguin2018/05/22(火) 09:17:06.85ID:Czl6p0FW
僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

G7BK2

41login:Penguin2018/10/29(月) 00:04:51.21ID:7tTWBMqX
ここは誰もいないのか

42login:Penguin2018/10/29(月) 07:54:58.73ID:v/2jA1j3
|・ω・*)チラ

43login:Penguin2019/03/31(日) 14:25:15.46ID:uyzTGgTF
ちんぽいらね

44login:Penguin2019/04/06(土) 21:50:42.27ID:D34QLrab
FESS使ってるよ

新着レスの表示
レスを投稿する