[VFOSSA] As Data Grows, So Grows Linux

Ngon Pham phamhuungon at gmail.com
Tue Mar 20 10:15:19 ICT 2012


Data is a new oil
http://www.youtube.com/watch?feature=player_embedded&v=9Jq4Qy1UeAE,
especially public and open data

Sẵn tiện cho cho em PR chút xíu ;)). Công ty em hiện chuyên về big data.
Hiện tại đã có dữ liệu của 150M+ Twitter users, 50M+ Google+ users và rất
nhiều data dùng để recommend cho các users này dựa trên sở thích của họ.

Về CSDL thì em xài MongoDB (một dòng setup là xong, map trực tiếp Java
class - data schema luôn). HBase thì thích hợp quy mô lớn nhưng khá nặng
nề. MySQL lâu đời nhiều tính năng mạnh, nhưng schema rất khó để thay đổi
(thêm một field nhiều lúc mất cả ngày).

Ở Việt Nam thì thị trường chưa tiềm năng lắm. Hiện tại em cũng đã crawl dữ
liệu từ Forums, Blog, News, Local Social, Wikipedia... Nhìn chung do đặc
thù thị trường VN khá nhỏ nên crawl về cũng ...chưa biết để làm gì. Tuy
nhiên với một số chính sách gần đây của chính phủ thì hi vọng thị trường
này sắp tới sẽ có nhiều triển vọng.

Ngôn




2012/3/18 Nguyen Hai Chau <nhchau at gmail.com>

>
>> NoSQL, theo mình thường được sử dụng cho các CSDL với dữ liệu cực lớn (a huge
>> amount, of data  and more). Định nghĩa của nó ở đây<http://nosql-database.org/>,
>> với rất nhiều thể loại khác nhau, không giống như những gì thường được nói
>> về Big 5 như ngày xưa: Oracle, DB2, Informix, Sybase và MS SQL Server.
>> nghialt
>>
>> Các hệ quản trị CSDL quan hệ cũng có thể sử dụng cho dữ liệu cực lớn mà
> bác.
>
>
> _______________________________________________
> POST RULES: http://wiki.vfossa.vn/guidelines:mailinglist
> _______________________________________________
> Members mailing list: Members at lists.vfossa.vn
> http://lists.vfossa.vn/mailman/listinfo/members
> VFOSSA website: http://vfossa.vn/
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.vfossa.vn/pipermail/members/attachments/20120320/eb8cd0f9/attachment.html 


More information about the Members mailing list