Data is a new oil <a href="http://www.youtube.com/watch?feature=player_embedded&v=9Jq4Qy1UeAE">http://www.youtube.com/watch?feature=player_embedded&v=9Jq4Qy1UeAE</a>, especially public and open data<div><br></div><div>
Sẵn tiện cho cho em PR chút xíu ;)). Công ty em hiện chuyên về big data. Hiện tại đã có dữ liệu của 150M+ Twitter users, 50M+ Google+ users và rất nhiều data dùng để recommend cho các users này dựa trên sở thích của họ.</div>
<div><br></div><div>Về CSDL thì em xài MongoDB (một dòng setup là xong, map trực tiếp Java class - data schema luôn). HBase thì thích hợp quy mô lớn nhưng khá nặng nề. MySQL lâu đời nhiều tính năng mạnh, nhưng schema rất khó để thay đổi (thêm một field nhiều lúc mất cả ngày).</div>
<div><br></div><div>Ở Việt Nam thì thị trường chưa tiềm năng lắm. Hiện tại em cũng đã crawl dữ liệu từ Forums, Blog, News, Local Social, Wikipedia... Nhìn chung do đặc thù thị trường VN khá nhỏ nên crawl về cũng ...chưa biết để làm gì. Tuy nhiên với một số chính sách gần đây của chính phủ thì hi vọng thị trường này sắp tới sẽ có nhiều triển vọng.</div>
<div><br></div><div>Ngôn</div><div><br></div><div><br></div><div><br><br><div class="gmail_quote">2012/3/18 Nguyen Hai Chau <span dir="ltr"><<a href="mailto:nhchau@gmail.com">nhchau@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="gmail_quote"><div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="gmail_quote"><br><div>NoSQL, theo mình thường được sử dụng cho các CSDL với dữ liệu cực lớn (<span style="font-family:Helvetica,Arial,sans-serif"> a <span style="font-weight:bold">huge </span></span><span style="font-family:Helvetica,Arial,sans-serif"><span style="font-weight:bold">amount</span>,<span style="font-weight:bold"> of </span></span><span style="font-family:Helvetica,Arial,sans-serif"><span style="font-weight:bold">data </span> and more</span>). Định nghĩa của nó <a href="http://nosql-database.org/" target="_blank">ở đây</a>, với rất nhiều thể loại khác nhau, không giống như những gì thường được nói về Big 5 như ngày xưa: Oracle, DB2, Informix, Sybase và MS SQL Server. <br>
nghialt<br></div><br></div></blockquote></div><div>Các hệ quản trị CSDL quan hệ cũng có thể sử dụng cho dữ liệu cực lớn mà bác. <br> </div></div><div></div>
<br>_______________________________________________<br>
POST RULES: <a href="http://wiki.vfossa.vn/guidelines:mailinglist" target="_blank">http://wiki.vfossa.vn/guidelines:mailinglist</a><br>
_______________________________________________<br>
Members mailing list: <a href="mailto:Members@lists.vfossa.vn">Members@lists.vfossa.vn</a><br>
<a href="http://lists.vfossa.vn/mailman/listinfo/members" target="_blank">http://lists.vfossa.vn/mailman/listinfo/members</a><br>
VFOSSA website: <a href="http://vfossa.vn/" target="_blank">http://vfossa.vn/</a><br></blockquote></div><br></div>