về việc tạo 1 search engine cho trang web

Nguyễn Thành Trung
(nt2)

New Member
Mình muốn viết 1 máy tìm kiếm cho 1 trang web nhỏ, bạn nào có kinh nghiệm thiết kế hoặc có ý tưởng gì có thể cho mình 1 mẫu để thiết kế (tạo CSDL, truy cập vào CSDL, ...) được không?
 
Hê hê mình mù về web à quản lý dữ liệu :d Nhưng mà thấy cách đơn giản nhất là đặt một cái link để nó search trên google kiểu như thế này :
xyz (thứ cần search) site :www..... (site của bạn) là được rồi
ví dụ
lab work site:www.doc.ic.ac.uk
 
Chỉnh sửa lần cuối:
Mình muốn tìm dữ liệu ngay trong site của mình cơ mà, nếu dùng google thì nó sẽ liệt kê 1 danh sách các kết quả, hầu hết ở những sites khác.
Search engine của HAO là 1 ví dụ nè: http://www.hn-ams.org/forum/search.php
 
Hiếu chơi khó anh ý :D

Trước hết anh Trung cần nói nội dung và các tiêu chí tìm kiếm cho search engine anh định làm, để hình thành cái CSDL đã, sau đó lập trình seach engine sau.
 
Nghe khó nhỉ ? :D Hồi đầu năm có mấy tiết học nói qua qua về quản lý dữ liệu, và google, nhưng mà bùng :D vì ko hứng lắm với net. Nhưng mà cũng tò mò quá. Hiếu hay ai đấy giải thích tổng quát về phương thức làm việc của google mà nó lại có thể cho ra đáp án nhanh trên lượng thông tin lớn như vậy được không ?

Trước giờ site nào không có search thì mình vấn search bằng google trên nó :D và thấy cũng tốt. Mà làm gì có kết quả của site khác xen vào đâu ?
 
Nguyên lý của Google thì chẳng ai biết được. Mỗi search engine mỗi khác ---> ko có gì để dựa vào cả, vả lại, Google có mỗi cái đó là cái cần câu cơm lớn nhất, nó chẳng ngu gì mà để mở. Đơn giản & dễ dùng nhất là fultext search của mySQL như Mediawiki.
 
Muốn làm search engine cho nhanh bằng google cũng dễ thôi :)

Wikipedia đã viết:
Google's services are run on several server farms, each consisting of many thousand low-cost commodity computers running stripped-down versions of Linux. While the company does not provide detailed information about its hardware, it was estimated in 2005 that they were using over 100,000 Linux machines. See Google platform for more details on their technology.
 
Nếu anh muốn search engine = java script thì em share mã nguồn cho .
Này xưa em làm web sites HIV/AIDS in Vietnam có làm bộ search này nhưng mà thuật toán nó hơi ngu một chút :))
Còn có loại search engine khác = máy nhưng em thấy nó tốn dung lg. k0 cần thiết :D
 
Cóc biết website của người ta như nào đã đòi share search engine :|, có hiểu gì ko mà viết loăng quăng thế :|
Chú share vào [email protected] cho anh xem với xem nó là cái gì :|
 
http://www-db.stanford.edu/~backrub/google.html

Research paper của Sergey Brin & Lawrence Page (google's founders) về google search engine. Trong này tóm lược những nguyên tắc sơ lược và cơ bản nhất của google thời kỳ sơ khai. Đây là một tài liệu khá hay cho những bạn nào muốn tìm hiểu về search engine.
 
Mình muốn làm cái search engine cho 1 trang web nhỏ thôi, không cần chi tiết như của HAO đâu. Cái chính là mình muốn biết nguyên tắc khi làm 1 search engine, từ khâu tạo database cho đến xử lý, ví dụ trong database thì mình cần lưu những gì.
Còn về google, mình thấy nhiều người thích nó vì thứ nhất là cái tên, thứ 2 là giao diện đơn giản, thứ 3 là tốc độ tìm kiếm nhanh. Google lưu khoảng 10 tỉ địa chỉ web, ngoài ra còn cả nội dung web nữa thì có thể thấy CSDL của nó lớn thế nào rồi. Không biết google nó dùng hệ quản lý CSDL nào nhỉ?
 
Thế thì anh lên index cho trang cho nó nhanh :-? theo keyword hoặc theo category :|
Còn không thì Search Maker Pro, download về là xài luôn :|
 
Đấy đấy
Em làm cái web search theo keyword với theo category cho nhanh

Cóc biết website của người ta như nào đã đòi share search engine , có hiểu gì ko mà viết loăng quăng thế
Chú share vào [email protected] cho anh xem với xem nó là cái gì


Gì đấy :D Cạnh khóe nhau à ? :D
 
Không hiểu Phúc làm search engine bằng Javascript thì phải nhập thông tin kiểu gì, rồi load cả kho dữ liệu ra thế nào thì mới truy cập trên trang đó được +_+
 
Đỗ Việt đã viết:
Không hiểu Phúc làm search engine bằng Javascript thì phải nhập thông tin kiểu gì, rồi load cả kho dữ liệu ra thế nào thì mới truy cập trên trang đó được +_+
Cũng có thể nhập tất cả vào array mà. 1 array cho html file name, 1 array cho category, 1 array cho keywords. Mỗi trang html có độ 10 keywords x 20 Bytes = 200 Bytes, 1 website có chừng 20 html files thì chỗ này mới độ 4 KB chứ mấy. Nếu chịu nhập 1 Javascript lớn khoảng 20 KB thì cái phần dành cho data này nhằm nhò gì :)
 
Phạm Duy Phúc đã viết:
Đấy đấy
Em làm cái web search theo keyword với theo category cho nhanh
Gì đấy :D Cạnh khóe nhau à ? :D

Anh cạnh khóe chú được lợi lộc gì :|, tại anh thấy chú tài quá nên anh muốn học tập thôi mà :|, đừng hiểu lầm nhé :D. share cho anh vào [email protected] với.

:D em có ý kiến thì này, câu hỏi của anh Trung đã rõ ràng đâu mà bâu vào trả lời được thì tài quá. Mong anh cho biết chi tiết thêm về website của anh ví dụ như chỉ là html đơn thuần hay là dạng như forum hoặc web động có dùng server technology gì không (PHP-MySQL, ASP....) hoặc chi tiết hơn thì anh cho cái link duyệt thử, đến lúc đấy bàn search engine sau ^_^
 
Chỉnh sửa lần cuối:
Cũng có thể nhập tất cả vào array mà. 1 array cho html file name, 1 array cho category, 1 array cho keywords. Mỗi trang html có độ 10 keywords x 20 Bytes = 200 Bytes, 1 website có chừng 20 html files thì chỗ này mới độ 4 KB chứ mấy. Nếu chịu nhập 1 Javascript lớn khoảng 20 KB thì cái phần dành cho data này nhằm nhò gì

Đấy đấy , đúng rồi đấy .
Mà ng` hỏi xin cách làm = CSDL cơ mà ? Sao lại JS :))

Anh cạnh khóe chú được lợi lộc gì , tại anh thấy chú tài quá nên anh muốn học tập thôi mà , đừng hiểu lầm nhé . share cho anh vào [email protected] với.
Em lại tưởng anh ghét em như ông Hiếu thì chết :))
 
Đấy đấy , đúng rồi đấy .
Mà ng` hỏi xin cách làm = CSDL cơ mà ? Sao lại JS
Thế thằng nào ở trên vừa bảo làm = JS cái gì?? Mà chú bảo cái đấy chú làm cho website HIV/AIDS VN. Cái link site đấy là gì ấy nhỉ?? Đưa lên đây anh ngó qua tí xem cái đấy nó ra làm sao. Chứ chú giỏi bốc phét lắm. :))
Em lại tưởng anh ghét em như ông Hiếu thì chết
Anh thì anh ko ghét chú. Anh ghét cái tính của chú. Mà cụ thể là bốc phét & thùng rỗng kêu to.
 
Ngô Nguyễn Duy đã viết:
Cũng có thể nhập tất cả vào array mà. 1 array cho html file name, 1 array cho category, 1 array cho keywords. Mỗi trang html có độ 10 keywords x 20 Bytes = 200 Bytes, 1 website có chừng 20 html files thì chỗ này mới độ 4 KB chứ mấy. Nếu chịu nhập 1 Javascript lớn khoảng 20 KB thì cái phần dành cho data này nhằm nhò gì :)

Anh Duy nói đoạn này em không hiểu lắm. Giả sử website đó có 20 links, mỗi html file khoảng 20KB, theo cách làm "nông dân" của em thì tạo 1 CSDL gồm 2 trường là links và contents, mỗi khi có 1 query thì mình search nội dung từng file rồi tạo 1 file html kết quả, gồm các links.
 
Back
Bên trên