Don’t Be Evil
Nhận định, Việt Nam January 19th, 2008
Sự kiện ầm ĩ nhất trong tuần này, chắc các bạn đều biết, là trang tìm kiếm Monava.vn được PR rầm rộ và ngay sau đó là những phát hiện thú vị trong kết quả trả về. Báo Tuổi Trẻ đã đăng một bài khá dài về chuyện này và tất nhiên ddth.com không thể bỏ qua. Tôi cũng thử dùng Monava để search từ khóa “Web 2.0 Vietnam” và so sánh với kết quả của Google tìm từ web và những trang từ Việt Nam. Kết quả là gần 100% giống nhau (trừ các kết quả phụ bị lọc bỏ). Các screenshot này sẽ tự nói lên toàn bộ câu chuyện (xin click để phóng to):
Bạn Khoa nói rằng sẽ RẤT NGẠC NHIÊN nếu Mr Huy, giám đốc của Monava.vn, chứng minh được “Monava cho kết quả hơi giống Google vì sử dụng thuật toán sắp xếp của Google“. Ai cũng biết rằng thuật toán của Google cực kỳ phức tạp, thường xuyên được chỉnh sửa để có các kết quả tìm kiếm đúng nhất và quan trọng hơn là dù bạn có trong tay thuật toán đó (điều gần như không thể) thì bạn cũng không thể có dữ liệu như của Google do hàng chục ngàn server ngày đêm index các trang web trên toàn thế giới. Chẳng hạn blog này từ ngày 12/12/2007 đến nay (mới hơn 1 tháng) đã được Google spider “viếng thăm” 829 link và các công cụ tìm kiếm khác cũng làm tương tự (xem hình lấy từ công cụ analytic). Và chỉ có bằng cách đó thì mọi thứ tôi hay bạn viết ra đưa lên mạng đều có thể tìm thấy qua Google hay Yahoo sau một vài ngày.

Đã có quá nhiều chuyện xung quanh vấn đề “biến của người thành của mình” trong giới IT Việt Nam những năm gần đây. Nó gợi tôi nhớ tới nguyên tắc “Don’t be evil” do chính Google đặt ra cho mình và gần như trở thành nguyên tắc ứng xử được ưa chuộng nhất trong thế giới Internet ngày nay đề cao tính minh bạch và không vi phạm quyền lợi của nhau.
Tôi tin rằng cuối cùng giới IT Việt Nam cũng sẽ phải tuân thủ nguyên tắc của luật chơi này. Internet hoạt động trên cơ sở nội dung (content) và các liên kết (link). Khi bạn dùng lại nội dung của ai thì phải có tham chiếu rõ ràng và nhưng kiểu tham chiếu không có liên kết (như Theo báo Thanh Niên) không được khuyến khích vì một trang web được xếp hạng bằng số liên kết trỏ tới nó. Nếu cả tôi và bạn đều không bao giờ tạo liên kết tới nhau thì cả hai đều cùng “chết chìm” trong bảng xếp hạng của các search engine.
Bạn có thể biên tập lại nội dung văn bản hay đồ họa của ai đó (nếu giấy phép sử dụng cho phép) nhưng đừng quên “credit” tác giả mà cách đơn giản nhất là tạo một liên kết tới trang web của họ. Chẳng hạn theme Wordpress gốc của trang web này do ericulous.com thiết kế, dù có chỉnh sửa khá nhiều tôi vẫn giữ liên kết tham chiếu tới họ vì đó là lý do duy nhất họ bỏ công sức làm ra và miễn phí sử dụng theme này.
Nói rộng ra là việc sử dụng các phần mềm mã mở (open source). Mã nguồn mở là một trong những nền tảng lớn tạo tiền đề cho việc phát triển web hiện đại. Bạn hoàn toàn có thể sử dụng miễn phí 100% LAMP để tạo nên các ứng dụng web 2.0 lớn nhất, phức tạp nhất (mà Facebook là ví dụ điển hình). Tuy nhiên đây là vài điều bạn có thể làm và không nên làm khi sử dụng mã nguồn mở:
- Bạn có thể hoàn toàn lấy mã nguồn và biên dịch theo ý muốn. Ví dụ, bạn có thể biên dịch máy chủ web Apache với các Mod bạn thích để đạt hiệu năng tối đa hay biên dịch MySQL cho mục đích riêng biệt (miễn là bạn biết chắc mình đang làm gì
). Tuy nhiên bạn không thể tuyên bố bản biên dịch đó là sản phẩm mới của mình. - Bạn có thể sửa source code theo ý của mình nhưng đừng “quên” công bố phần sửa đổi nếu giấy phép sử dụng yêu cầu như vậy.
- Bạn có thể thoải mái phân phối lại các thư viện mã nguồn mở trong sản phẩm của mình miễn là bạn giữ nguyên xuất xứ, đóng gói kèm theo giấy phép sử dụng và sản phẩm của bạn tuân thủ những yêu cầu mà (các) giấy phép này đặt ra nếu có.
- Với một số giấy phép rộng rãi nhất, đặc biệt là các thư viện Ajax - JavaScript, bạn có thể obfuscate, nén lại bằng các công cụ riêng nhưng đừng quên kèm phần tham chiếu gốc gác vào các file này.
Để tránh các rắc rối khi sử dụng mã nguồn mở cách tốt nhất là bạn nên công khai minh bạch tối đa những gì bạn đang sử dụng. Thậm chí, bạn sẽ đóng góp rất nhiều cho cộng đồng nếu viết về kinh nghiệm sử dụng và các vấn đề gặp phải khi dùng các sản phẩm này. Bạn sẽ thấy rằng đây là nguyên tắc WIN-WIN — tất cả cùng có lợi mà các đồng nghiệp phương Tây đã tuân thủ một cách tự giác và thích thú.
“Don’t be evil” với chúng ta trước hết là đừng cố che giấu những gì mình đang sử dụng và nhận thành quả của người khác làm của mình. Nếu không chỉ trong tích tắc uy tín của bạn và công ty bạn sẽ tan thành mây khói. Xin hãy nhớ câu: Mua danh ba vạn, bán danh ba đồng!

it’s said that Google has about 450,000 servers …
Ban đọc bài viết này có nhiều suy nghĩ, nghĩ sâu hơn một chút, nhưng không thể nói ra bằng lời được.
Có người bạn Ban nói: “Người Việt mình cái gì cũng có, trừ đạo đức nghề nghiệp!” Riêng chuyện Nguyễn Quang Huy nói anh ta sử dụng chung thuật toán sắp xếp của Google cũng đủ thấy anh ta lố bịch thế nào. Thế nhưng trước khi có scandal này, báo chí vẫn tung hê Monava đó chứ, giá để viết một vài trên 2 trang của Thanh Niên là 35tr VND (cách đây 2 năm), đạo đức không mang lại tiền bạc. Và sau scandal này, có mấy ai nhận thấy đây là lại là một vết nhơ của giới IT, để im lặng, bớt chửi đổng, và quyết tâm làm một cái gì đó đàng hoàng và minh bạch hơn đâu?
Viết theo đơn đặt hàng không có gì mới lạ tại Vietnam hay bất kỳ đâu trên TG. Tuy nhiên dù là theo đơn đặt hàng thì người viết phải có trình độ nhất định. Đã đành rằng các tờ báo tung hô Monava không chuyên về CNTT nhưng nếu Ban đọc chuyên mục Technology của NYT hay WP thì có thể thấy các bài viết của họ còn sâu sắc hơn cả những tờ báo chuyên viết về CNTT. Đấy mới tạo nên giá trị của tờ báo.
Ý Ban nói ở đây là ý Quang nói đó!
Họ sẵn sàng viết vì tiền, anh được ca ngợi ở đây không phải vì anh giỏi, anh hay mà là vì anh có tiền.
Nguyen Hoang Group phan doi bao Tuoi Tre:
http://www.nguyenhoang.com.vn/?act=news&opt=view_detail&id=146
Hmm, such a stupid reaction! Let Google say about this. I’ve never seen any company in the world using Google search results without permission. Pls see Google TOS:
http://www.google.com/accounts/TOS
5.5 Unless you have been specifically permitted to do so in a separate agreement with Google, you agree that you will not reproduce, duplicate, copy, sell, trade or resell the Services for any purpose.
Never know if they are totally lack of legal knowledge or they just ignore it for their purpose?
Haha chuyện này cũng tương tự như JBuilder 2007 đoạt giải “IDE of the year” thôi
Chuyện này làm em nghĩ đến ông bầu sô trong phim “Cảnh sát hình sự” nói với em ca sĩ:
“Lăng xê kiểu scandal - Tức là tạo scandal, lên nhanh, nhiều người biết, ầm ĩ báo chí, nhưng…xuống cũng nhanh, nhanh bị lãng quên”
Tôi thật sự không hiểu tại sao các site web 2.0 của VN luôn tự định vị mình ở vị trí đối đầu (thách thức) với Google và Yahoo (1 điểm thú vị là chưa thấy ai muốn thách thức M$).
Baomoi dang test digg clone a
Thách thức Microsoft trên desktop application là điều gần như không thể còn trên web ngày nay M$ không gây nhiều ảnh hưởng. Vì thế người ta thích cạnh tranh với Yahoo hay Google hơn. Không lẽ lại nói “Tôi sẽ làm một search engine mà sẽ đuổi kịp Live search tại VN trong 3 năm tới.” Sẽ chẳng ai quan tâm!
Theo Ban thì có 2 ý trong việc tuyên bố mình không thua kém gì Yahoo hay Google:
1. Không coi các search engine hiện có ở Việt Nam ra gì? Ở Việt Nam chưa có gì xứng đáng để họ vượt qua, dù là họ mới ra đời nhưng chỉ những search engine tầm cỡ thế giới mới đủ tư cách để họ chinh phục.
2. Gây shock, tạo luồng suy nghĩ tích cực cho thương hiệu của mình, để báo chí dễ đào sâu viết bài PR, tránh đi những yếu tố yếu kém mà mọi công ty Việt Nam luôn dấu diếm: Nền tảng kỹ thuật và hệ thống phát triển của công ty.
Dân trí người Việt Nam còn thấp nên mới có những trò bong bóng như thế này, một vài năm tới dân trí cao hơn thì những trò như thế này sẽ chỉ có đường tới địa ngục. Dân trí thức trong thời web 2.0 mà chơi trò mị dân là thua rồi, cạnh tranh bằng năng lực chứ cạnh tranh bằng ..bong bóng thì thua là cái chắc!
@Quang : Nếu M$ là bất khả xâm phạm trên desktop thì Google cũng là độc tôn trên WWW (hoặc ít nhất là trong việc monetize the WWW). Nếu muốn thách thức thì chọn FPT hay Vinagame nghe còn hợp lý hơn.
Vì thế việc định vị đối đầu với Google chỉ là để PR (đúng như ý 2 của Ban, mượn thương hiệu của Google để đánh bóng bản thân), và về khía cạnh này tôi không nghĩ là họ làm sai. Chỉ có điều tôi băn khoăn là sao không định vị mình là “máy tìm kiếm của người Việt” ??
Đó là cái mà người Việt cần chứ không phải là Google VN (bởi vì Google VN vẫn sờ sờ ra đó http://www.google.com.vn và đang chạy quá tuyệt vời). Cái đó cũng như người TQ có thể tự hào mà nói rằng Baidu là Baidu chứ không phải Google của TQ.
Nếu cứ PR Cyvee là LinkedIn của VN, Chodientu là eBay của VN, Vinagame là Kingsoft của VN, Baamboo là Baidu của VN thì có lẽ ngoài giới công nghệ (2.0) ra chả ma nào quan tâm. Nhưng Yahoo và Google (Top 2 site tại VN) thì lại là những thương hiệu quá đỗi nổi tiếng. Trớ trêu thay hầu hết các vụ ầm ĩ gần đây đều liên quan đến việc ăn theo 2 thương hiệu này.
Khởi đầu 1 web 2.0 ở VN rất dễ, mô hình có sẵn (chỉ việc copy và localize), không cần nhiều tiền đầu tư (1-2 developer và 1 server là đủ). Thế nhưng ít DN chú trọng vào việc phát triển chiều sâu về công nghệ cũng như sáng tạo nhưng giá trị cốt lõi cho công ty để tạo được sự khác biệt và bền vững mà đã vội vã đánh bóng tên tuổi => nhẹ thì sập server
mà nặng thì sập cty.
Hoàn toàn đồng ý với @Baomoi. Cheers.
Anh baomoi phân tích rất hay, tuy nhiên một điểm em chưa đồng ý là “ít doanh nghiệp đầu tư chiều sâu vào ý tưởng và công nghệ”.
Thực chất thì ngược lại như vậy, họ vẫn âm thầm nghiên cứu và sáng tạo. Tuy nhiên ở thời buổi internet phát triển ào ào này họ buộc phải có những cú “ra mắt hoành tráng” nhằm “cắm sào” vào mảnh đất internet Việt Nam, để người ta biết họ là ai. Việc ra mắt và cắm sào thế nào còn tùy vào chiến lược của họ, chiến lược là chiến lược còn thành công hay không lại là vấn đề khác.
Đầu tư sáng tạo và đầu tư vào chiều sâu công nghệ là cuộc marathon dài hơi và cũng chính là công việc của tất cả các doanh nghiệp, của cả chúng ta nữa nếu còn muốn tồn tại ở thời đại này.
@A.Quang
Wordpress bị một bug gì đó, nhầm cookie hoặc session của em và A. baomoi
Vụ này xét cho cùng cũng không đáng phải om xòm thế.
Như lệ thường muốn ra mắt Monava sẽ phải trả tiền để lên báo. Các nhà báo của chúng ta thì vẫn vậy, có form sẵn điền vào và mô đi fê đi chút ít và thế là “Monava blah blah” ra đời. Google, Yahoo, eBay, younameit đã có sẵn trong cái form đó nên hầu như dịch vụ nào ra mắt cũng so sánh với mấy ông kẹ này.
Monava bị phản đối trong cộng đồng IT (ít ra là trong ddth.vn) là do thị trường đã quá no và…chán với “Google của Việt Nam, Yahoo của VN, MySpace của VN…” rồi đâm ra phản ứng mạnh dẫn đến những vụ phanh phui hay những tin đồn không tốt.
Cũng là một bài học cho họ và những người khác nữa.
“Khởi đầu 1 web 2.0 ở VN rất dễ, mô hình có sẵn (chỉ việc copy và localize), không cần nhiều tiền đầu tư (1-2 developer và 1 server là đủ). Thế nhưng ít DN chú trọng vào việc phát triển chiều sâu về công nghệ cũng như sáng tạo nhưng giá trị cốt lõi cho công ty để tạo được sự khác biệt và bền vững mà đã vội vã đánh bóng tên tuổi => nhẹ thì sập server
mà nặng thì sập cty.”
@ Bác Baomoi.vn hình như gặp problem này rùi phải ko? Thấy ban đầu thì dễ nhưng phát triển theo kiểu chất lượng như bác nói đâu phải dễ, 2 developers + server = 10 triệu một tháng, trả tiền cũng muốn khùng chứ ở đó mà dễ. Phát triển kiểu này thì bác phải chờ tới 3 năm mới có thể bán được quảng cáo hoặc thu lợi nhuận. Còn cứ nhảm nhí, gây tò mò, gây shock, sexy, gái đẹp, hot…. là nhanh chóng thu lại phí đầu tư hơn cả.
Nguyễn Hoàng nói là đầu tư cho Monava 500 ngàn USD, con số khó tin thật, Nguyễn Hoàng này chắc cũng muốn đi theo cách của 24h.com.vn là lên trên trời trước rồi mới mua máy bay đây.
@ Vinafriend có phần đúng khi nói là dân trí Việt Nam thấp, người sử dụng thì nhiều nhưng chủ yếu là chat và giải trí (Boss của Cyvee cũng công nhận điều này mà), cách mị dân của Monava xem ra không hợp thời chút nào.
Thôi thì chờ đợi thêm xem thế nào trong năm 2008 và nhất là thông cáo báo chí mà Giám đốc của Monava sẽ trả lời ;)) chắc lại thêm một trò láu cá nữa thôi!
Thực ra để làm một search engine thì có nhiều cách. Tuyên bố thẳng là tổng hợp từ các search engine khác như dogpile.com. Hoặc dùng openWebSpider làm framework cũng được. Tuy nhiên cách thứ 2 này cần đầu tư về server và developer đúng như anh baomoi.vn nói. Nhưng cướp của người khác thế này thì thật là lố bịch :)) Theo như Google nói, thì “Don’t be evil”.
@baomoi.vn: Chúc mừng anh dc giải Trí tuệ Việt Nam
http://www.thanhnien.com.vn/CNTT/2008/2/5/225241.tno
Bài viết nhằm hồi mồng 4 tháng 2 tức 28 Tết Âm lịch
Read for fun only
Mình chỉ ko hiểu tại sao những trò quá lố bịch này lại có thể được nghĩ ra :D. Hiện giờ cái logo Powered by Google đã hiện ra trên monava, ko biết NHG hay bác huy gì đó có công văn nào ko ??
Nói chung là khá chán
Dân IT chán quá, ngay từ mấy hôm đầu rầm rộ mình đã biết chẳng có cái gì của họ cả. Cuối cùng thì sự thật vẫn được phơi bày vì không người này nói người khác sẽ nói. Tuy nhiên 95% dân ta mù tin học và tôi tin chắc rằng vẫn nhiều người bị lừa, bị phỉnh.
Báo chí thì lá cải, thử tìm mấy từ khoá ==> rầm rộ ca ngợi.
Mình Cày SEO như thế để TOP Google cưới cùng thấy TOP luôn ông “MaNoVA” :)) thích thật, chắc Google nó không INdex ông “MaNoVi” này như Yahoo đâu nhỉ :)) hài quá.
Khi đó chủ nhân bảo Tôi cấm Google Index thì sao nó vào được.
[...] người tham gia Internet nên tuân thủ các qui tắc của cuộc chơi như trong bài Don’t be evil. Tôi cũng tránh các chỉ trích hướng về một cá nhân nào đó trong khi có thể [...]
Trong bài viết này có một thông tin làm mình khá quan tâm đó là số liệu thống kê các spider. Theo như mình được biết thì google analytics dùng javascript để theo dõi các visits mà các spider thì thường không chạy các javascript này. Mình xem trong GG analytics của mình cũng không có. Nếu có thể thì bạn vui lòng chỉ cho mình cách làm được không. Cảm ơn bạn rất nhiều.
@Hoang Vu: Anh có thể thấy dc thông tin về các bot/crawler nếu cài plugin Statpress.
Google Analytics kg track các thông tin này đúng như anh nói.
Cảm ơn bạn Hồng Quang đã reply. Mình hiện tại phụ trách theo dõi các thông số web, visitor trending, SEO của công ty nên cần biết tỉ lệ vistors/spiders. Tuy nhiên plugin này chỉ áp dụng cho wordpress, không biết có cách nào áp dụng cho 1 website bình thường không nhỉ? (Mình đã search trên google thì tất cả các câu trả lời đều là không thể!)
Nếu kg dùng Wordpress có lẽ chì còn cách phải tự viết lấy chương trình analytics cho việc này. Về nguyên tắc các web request đều có UserAgent và các bot/crawler đều có UserAgent đặc thù. Anh co thể tham khảo codes của Statpress plugin để tìm hiểu cơ chế làm việc của nó và tạo ra cái tương tự cho trang web của cty mình.Cheers.
“Tôi tin rằng cuối cùng giới IT Việt Nam cũng sẽ phải tuân thủ nguyên tắc của luật chơi này. Internet hoạt động trên cơ sở nội dung (content) và các liên kết (link). Khi bạn dùng lại nội dung của ai thì phải có tham chiếu rõ ràng và nhưng kiểu tham chiếu không có liên kết (như Theo báo Thanh Niên) không được khuyến khích vì một trang web được xếp hạng bằng số liên kết trỏ tới nó. Nếu cả tôi và bạn đều không bao giờ tạo liên kết tới nhau thì cả hai đều cùng “chết chìm” trong bảng xếp hạng của các search engine.” –> Good “Share a lot Get a lot”
@ A Hong quang, anh share cho em cai plug in Top 10 dc khong? cai top 10 cua em khong chay dc, mac du em da test tren localhost thi chay ngon lun. khi upload len thi cha hieu sao no eo chay a a?
@manhvt: Dung spam comment. Neu co cau hoi kg lien quan gi de bai viet thi sao kg mail cho anh Quang?
A cool article!