米柚愛好者論壇

標題: 新增 Google 自訂的 站內搜尋 [打印本頁]

作者: 鸚鵡    時間: 2014-2-11 22:37
標題: 新增 Google 自訂的 站內搜尋
本帖最後由 鸚鵡 於 2014-2-12 21:41 編輯

原始標題:有人玩過 sphinx 嗎?

我想裝起來,讓論壇支援中文的全文檢索
所以... 有人有玩過嗎??




雖然 discuz 本身有支援 sphinx 做全文檢索的功能
但是因為作業模式撈文章內容出來,透過演算法 將一整串文字分解成數量不等的詞彙
再針對慈會與原本內容加上關聯

所以初次完成之後 還要不斷的進行差異處理 並更新
所以最終我決定不使用這個功能,改採用 Google 的自訂搜尋

缺點是沒辦法即時,必須等到 Google 爬過新文章才會搜尋的到
以這篇來說:http://mi.ezbox.idv.tw/thread-754-1-1.html
還沒24小時滿 Google 已經蒐錄索引了
這速度應該也還算能接受


作者: 夢想的天空    時間: 2014-2-11 22:42
你不要這麼專業,好不好?
學你的

作者: isakira    時間: 2014-2-11 22:44
沒用過。

作者: 謎漾    時間: 2014-2-11 22:46
只玩過最後的結果就是 ....
全文檢索
作者: 楠43    時間: 2014-2-11 22:46
支持~
不過我沒用過...
作者: zcguo    時間: 2014-2-11 22:50
這....
作者: 鸚鵡    時間: 2014-2-11 22:51
夢想的天空 發表於 2014-2-11 22:42 static/image/common/back.gif
你不要這麼專業,好不好?
學你的

完全不懂唷 哪裡專業了 XDD
作者: 鸚鵡    時間: 2014-2-11 23:10
眉頭一皺... 光是分詞就搞死我了
作者: Mi2Sir    時間: 2014-2-11 23:15
沒玩過
但看到全文檢索,就很高興
但這會不會嚴重影響系統效能?
作者: 鸚鵡    時間: 2014-2-11 23:21
Mi2Sir 發表於 2014-2-11 23:15 static/image/common/back.gif
沒玩過
但看到全文檢索,就很高興
但這會不會嚴重影響系統效能?

就是為了效能 才選這個 0.0

會不會嚴重 沒玩玩看不知道呀
反正現在順的很

(當初光是儲存設備就花了1萬多,值得)

下班去~~
作者: 楠43    時間: 2014-2-11 23:24
鸚鵡 發表於 2014-2-11 23:21 static/image/common/back.gif
就是為了效能 才選這個 0.0

會不會嚴重 沒玩玩看不知道呀

現在外面一定很冷...
等一下一出去就      

(一萬多有點恐怖...
作者: yoyo930021    時間: 2014-2-11 23:49
好專業  
一萬多看來是raid 陣列
作者: kid888    時間: 2014-2-12 00:08
這邊光網頁開啟速度.隔壁只能望塵莫及
在搞下去...隔壁會顏面盡失吧
作者: 鸚鵡    時間: 2014-2-12 01:22
yoyo930021 發表於 2014-2-11 23:49 static/image/common/back.gif
好專業  
一萬多看來是raid 陣列

我買不起RAID卡  
作者: icebee    時間: 2014-2-12 01:26
網路上有很多相關的文件可以參考

不過要找到很詳細的

就很不容易囉....
作者: icebee    時間: 2014-2-12 01:27
本帖最後由 icebee 於 2014-2-12 01:28 編輯

如果有需要小額贊助

再說一下

太多就沒辦法囉
作者: 鸚鵡    時間: 2014-2-12 01:31
icebee 發表於 2014-2-12 01:26 static/image/common/back.gif
網路上有很多相關的文件可以參考

不過要找到很詳細的

和中文有關 多數都是對岸的
台灣還真沒人處理

我在慢慢來找資料囉
作者: icebee    時間: 2014-2-12 01:40
應該還是有不少啦

只是需要東一塊 西一塊的

分得很開

作者: 鸚鵡    時間: 2014-2-12 02:22
icebee 發表於 2014-2-12 01:40 static/image/common/back.gif
應該還是有不少啦

只是需要東一塊 西一塊的

我比較頭大的是 分詞 的問題
每個中文字切割 等於有跟沒有一樣


作者: Kobe0083    時間: 2014-2-12 03:16
講得出軟體名就足以嚇死小弟我了
作者: 鸚鵡    時間: 2014-2-12 03:52
爬文完畢,明天找時間來安裝看看
中文詞庫也找到了


作者: yoyo930021    時間: 2014-2-12 07:40
鸚鵡 發表於 2014-2-12 01:22 static/image/common/back.gif
我買不起RAID卡

軟體raid   XD
作者: 凱366    時間: 2014-2-12 10:18
鸚鵡 發表於 2014-2-12 01:31 static/image/common/back.gif
和中文有關 多數都是對岸的
台灣還真沒人處理

參考:
http://blog.wu-boy.com/2009/06/p ... A2%E7%B4%A2-on-php/
作者: 鸚鵡    時間: 2014-2-12 15:33
編譯好了 測試可以動

但是 要一直重跑資料來更新相關字詞等關鍵字

所以...
還是使用 Google 的 自訂搜尋 來的快速、省事 又準確 0.0
作者: 凱366    時間: 2014-2-12 15:49
鸚鵡 發表於 2014-2-12 15:33 static/image/common/back.gif
編譯好了 測試可以動

但是 要一直重跑資料來更新相關字詞等關鍵字

辛苦你了~
但是你又學會了一項技能  
作者: bland579    時間: 2014-2-12 16:01
那是什麼東西?!(沒聽過...)

不過中文全文檢索...看起來是個好東西...
作者: 日月光軍    時間: 2014-2-12 20:44
本帖最後由 日月光軍 於 2014-2-12 20:45 編輯

有一件事從論壇開始我就一直想著,目前我們論壇軟硬體都是由鸚鵡所負擔,隨著人數逐日攀升及時間流逝~很多耗材或硬體可能都需更換,升級以因應...大家都是辛苦賺錢的上班族~若都由鸚鵡來負擔,著實過意不去..所以我一直有想說是不是由創壇就加入的我們,或多少名額的自願者,每個月以例如:300或500的固定金額,挹助我們論壇設備的維護與更新,並委請鸚鵡費心打點....不知大家意見如何~
作者: 鸚鵡    時間: 2014-2-12 21:34
日月光軍 發表於 2014-2-12 20:44 static/image/common/back.gif
有一件事從論壇開始我就一直想著,目前我們論壇軟硬體都是由鸚鵡所負擔,隨著人數逐日攀升及時間流逝~很多耗 ...

現階段 先維持原樣就好

我是覺得 碰到錢,很多東西就會變得複雜 @@

作者: 鸚鵡    時間: 2014-2-12 21:41
我測試了一下 搜尋效果還不差
作者: 日月光軍    時間: 2014-2-12 21:42
鸚鵡 發表於 2014-2-12 21:34 static/image/common/back.gif
現階段 先維持原樣就好

我是覺得 碰到錢,很多東西就會變得複雜 @@

所以我才一直只是"想而未提"
作者: 鸚鵡    時間: 2014-2-12 21:45
日月光軍 發表於 2014-2-12 21:42 static/image/common/back.gif
所以我才一直只是"想而未提"

其實站上很多人都跟我提過這部份

現階段而言 還OK的啦~

感謝您呀
作者: 日月光軍    時間: 2014-2-12 21:48
鸚鵡 發表於 2014-2-12 21:45 static/image/common/back.gif
其實站上很多人都跟我提過這部份

現階段而言 還OK的啦~

不客氣啦~但真有需要鸚鵡您可別客氣喔^^
作者: Mi2Sir    時間: 2014-2-13 09:47
鸚鵡 發表於 2014-2-12 21:34 static/image/common/back.gif
現階段 先維持原樣就好

我是覺得 碰到錢,很多東西就會變得複雜 @@

有需要的話,別客氣,請提出!
作者: Mi2Sir    時間: 2014-2-13 09:48
搜尋還是龍頭厲害

剛試了一下,很順,很快,很方便!
作者: icebee    時間: 2014-2-13 10:17
鸚鵡 發表於 2014-2-12 21:45 static/image/common/back.gif
其實站上很多人都跟我提過這部份

現階段而言 還OK的啦~

真有需要的時候真的要說出來啊

不然你出錢又出力的


作者: 凱366    時間: 2014-2-13 10:17
多了這功能真的不錯~
google搜尋還是很厲害的




歡迎光臨 米柚愛好者論壇 (https://mi.ezbox.idv.tw/) Powered by Discuz! X2.5