[VFOSSA] As Data Grows, So Grows Linux
Nguyễn Vũ Hưng
vuhung16plus at gmail.com
Tue Mar 20 11:10:49 ICT 2012
Hi Ngôn,
2012/3/20 Ngon Pham <phamhuungon at gmail.com>:
>
> Sẵn tiện cho cho em PR chút xíu ;)). Công ty em hiện chuyên về big data.
> Hiện tại đã có dữ liệu của 150M+ Twitter users, 50M+ Google+ users và rất
> nhiều data dùng để recommend cho các users này dựa trên sở thích của họ.
>
> Về CSDL thì em xài MongoDB (một dòng setup là xong, map trực tiếp Java class
> - data schema luôn). HBase thì thích hợp quy mô lớn nhưng khá nặng nề. MySQL
> lâu đời nhiều tính năng mạnh, nhưng schema rất khó để thay đổi (thêm một
> field nhiều lúc mất cả ngày).
>
Bên mình cũng đang đụng tới những bản vài chục, vài trăm triệu records
(bài báo tiếng Việt trong 5 năm),
số lượng users khoảng 1 triệu, có dùng Lucence và Solr (thanks Ngôn
nhiều) cũng như Sphinx trên MySQL.
> Ở Việt Nam thì thị trường chưa tiềm năng lắm. Hiện tại em cũng đã crawl dữ
> liệu từ Forums, Blog, News, Local Social, Wikipedia... Nhìn chung do đặc thù
> thị trường VN khá nhỏ nên crawl về cũng ...chưa biết để làm gì. Tuy nhiên
> với một số chính sách gần đây của chính phủ thì hi vọng thị trường này sắp
> tới sẽ có nhiều triển vọng.
Sẽ liên lạc offline để... xin :)
--
Best Regards,
Nguyen Hung Vu [aka: NVH] ( in Vietnamese: Nguyễn Vũ Hưng )
vuhung16plus{remove}@gmail.dot.com , YIM: vuhung16 , Skype:
vuhung16plus, twitter: vuhung, MSN: vuhung16.
http://www.facebook.com/nguyenvuhung
http://nguyen-vu-hung.blogspot.com/
Học tiếng Nhật: http://hoc-tiengnhat.blogspot.com/
Vietnamese LibreOffice: http://libo-vi.blogspot.com/
Mozilla & Firefox tiếng Việt: http://mozilla-vi.blogspot.com/
More information about the Members
mailing list