Trần Sỹ Hoàng Nam.
Khoa học dữ liệu đang
dần trở thành một xu thế trong xã hội hiện nay với ví dụ là sức mạnh khó có thể
chối cãi tới từ một vài cái tên nổi tiếng như Google, Amazon, Facebook, Alibaba… Vậy khoa học dữ liệu
quan trọng như thế nào, làm sao để bắt nhịp được với bánh xe vốn đã lăn bánh
trên con đường xu thế ấy, thị trường quốc tế trả lời thế nào trước câu hỏi về
“Khoa học dữ liệu”? Hôm nay, chúng ta sẽ có cơ hội đi sâu hơn về vấn đề này
trong cuộc trò chuyện với một cựu sinh viên Kỹ sư tài năng Toán Tin đang làm về
khoa học dữ liệu ở Hà Lan.
- Anh có thể chia sẻ một số thông tin trích ngang của anh được không ạ?
Anh
tên là Chu Mạnh Dũng, Kỹ sư tài năng Toán Tin – K46. Hiện anh là Data Scientist
ở Financial Times Media Group của Hà Lan.
- Từ khi tốt nghiệp kỹ sư tới nay, anh đã trải qua quá trình học tập và làm
việc như thế nào ạ?
Anh
tham gia khoá học Kỹ sư Tài năng của khoa Toán – Tin ứng dụng (nay là Viện Toán ứng dụng và Tin học - SAMI),
trường Đại học BKHN từ năm 2001 đến 2006. Trước khi tốt nghiệp đại học, anh
nhận được học bổng cao học của chính phủ Hà Lan. Anh học cao học về Computational
Science (khoa học tính toán) ở trường đại học Amsterdam.
Sau đó anh làm nghiên cứu 5 năm, cũng ở trường Amsterdam về ứng dụng của trí
tuệ nhân tạo và máy học (Machine Learning) trong công nghệ xử lý ảnh và
video.
Đến
năm 2013 anh rời trường đại học để làm công ty ở ngoài. Anh rất hứng thú với
việc áp dụng những công nghệ mình đã học và nghiên cứu ở môi trường đại học vào
những bài toán thực tế để giúp các công ty nâng cao hiệu suất làm việc. Hiện
tại anh đang làm Data Scientist cho công ty Financial Times Media
Group của Hà Lan. Anh đang triển khai hai dự án: (1) xây dựng News
Recommendation Systems. Hệ thống này trợ giúp người đọc
nhanh chóng tìm được những bài báo mà họ quan tâm. Hệ thống cũng có thể tự gợi
ý những bài báo cho người đọc dựa vào sở thích của họ; (2) Trong dự án thứ hai,
bọn anh triển khai cùng văn phòng marketing của công ty. Anh xây dựng phần mềm
dự đoán hành vi của khách hàng. Phần mềm có dự đoán những khách hàng có khả
năng sẽ sớm cắt hợp đồng với công ty (churn prediction). Nhóm bên marketing sẽ
chủ động liên hệ với những khách hàng này đế xem công ty có thể giúp được họ gì
hay không.
- Khi còn đi học và sau khi ra trường, anh đã đạt được những thành tích gì mà
anh cảm thấy tự hào ạ?
Trong
quá trình học đại học ở trường BKHN anh tham gia những dự án nghiên cứu cho
sinh viên từ khá sớm. Qua đó, anh nhận được giải sinh viên nghiên cứu quốc gia
và giải của VIFOTEC. Kết thúc đại học, anh đạt thủ khoa của trường ĐHBKHN
năm 2006. Học bổng của chính phủ Hà Lan giúp anh có được cơ hội học cao học và
đạt được bằng giỏi của trường đại học Amsterdam. Trong quá trình nghiên cứu,
bài báo mà anh ưng ý nhất là bài báo trên tạp chí TPAMI về tổng quan các thuật toán trong
video object tracking. Bài báo cho đến nay đã được nhiều bài báo khác
trich dẫn.
Trình bày
poster về bài báo khoa học ở Sicily, Italy, 2009.
- Khoa học dữ liệu cần nhất những kiến thức gì mà Viện có thể cung cấp cho sinh viên ạ?
Về
mặt kỹ thuật, khoa học dữ liệu không phải là một lĩnh vực mới. Những kỹ
thuật/công nghệ dùng trong khoa học dữ liệu đã và đang được phát triển từ khá
lâu trong giới khoa học, đặc biệt là toán học và tin học. Nhờ sự bùng
nổ về dữ liệu số hoá trong những năm gần đây, những kỹ thuật trong trí tuệ nhân
tạo và máy học đã và đang được áp dụng ngày càng nhiều trong thực tế. Nhìn vào
khía cạnh này, Viện Toán ứng dụng và Tin học của trường
ĐHBKHN là một nơi rất phù hợp để đào tạo và hỗ trợ sinh viên
trong việc học và nghiên cứu về khoa học dữ liệu.
Viện
có thể trang bị cho các bạn sinh viên những kiến thức cơ bản và nâng cao về trí
tuệ nhân tạo và máy học. Đây là những kỹ năng rất cơ bản của khoa học dữ liệu.
Nó sẽ giúp cho các bạn có thể xử lý dữ liệu trong những bài toán thực tế. Xác
suất thống kê cũng là một thế mạnh của Viện mình. Khoa học dữ liệu dùng rất nhiều
xác suất thống kê bởi nó cho phép mình hiểu được nhiều hơn về đặc trưng của dữ
liệu.
Bên
cạnh đó, Viện Toán Tin có thể cung cấp những khoá học về cơ sở dữ
liệu: làm sao để tổ chức và lưu dữ liệu một cách hiệu quả, đặc biệt khi lượng
dữ liệu là cực lớn? Làm sao để tìm kiếm dữ liệu một cách hiệu quả?
Cùng đồng nghiệp đi hội thảo ở Hy Lạp.
- Viện SAMI đã để lại trong anh những kỷ niệm đặc biệt
gì mà anh sẽ không bao giờ quên ạ?
Anh
có rất nhiều kỷ niệm đặc biệt với Viện Toán Tin. Những kỷ niệm đặc biệt nhất
gắn liền với thầy Phan Trung Huy. Anh biết thầy lần đầu qua môn học về automat.
Sau đó là môn về máy học. Thầy có kiến thức rất sâu về những lĩnh vực này. Hơn
nữa, thầy còn rất nhiệt tình trong việc truyền đạt kiến thức cho sinh viên, đặc
biệt khi sinh viên có câu hỏi. Anh làm nghiên cứu với thầy trong hai dự án
nghiên cứu cho sinh viên. Thầy giúp bọn anh học hỏi được rất nhiều, không chỉ
về kiến thức chuyên môn, mà còn cả những kỹ năng khi làm việc nhóm.
- Anh đánh giá như thế nào về tầm quan trọng của Khoa học dữ liệu trong xã hội
hiện nay?
Khoa
học dữ liệu sẽ giúp chúng ta tạo ra nhiều dịch vụ hữu ích cho xã hội. Sự phát
triển rất nhanh của công nghệ thông tin đã làm một phần rất lớn của xã hội hiện
nay được số hoá. Một trong những sản phẩm của việc số hoá này là dữ liệu: dữ
liệu của bản thân những websites, dữ liệu do người dùng sinh ra, dữ liệu của
những thiết bị số hoá,... Dữ liệu đã trở thành một nguồn “nguyên liệu” mới
trong xã hội ngày nay, bên cạnh những thứ truyền thống như xăng dầu, điện và
nước. Khoa học dữ liệu cho phép chúng ta khai thác được nguồn nguyên liệu mới
này. Điều này có thể mang lại rất nhiều tiện ích mới cho xã hội. Ví dụ: thông
qua dữ liệu, các công ty có khả năng hiểu thêm về khách hàng của mình. Thông
qua dữ liệu hình ảnh chụp X-quang, các bệnh viện có thể tự động hoá một số quá
trình chẩn đoán hình ảnh, trợ giúp thêm công việc của bác sỹ.
- Tại sao anh lại chọn Hà Lan làm điểm đến của mình? Hà Lan có thế mạnh gì
trong ngành Toán
Tin, hay công việc của
anh? Anh đã làm gì để tạo cho mình cơ hội tốt nhất để sang bên đó?
Trong
quá trình học đại học, ngoài việc học chuyên môn, anh cũng tập trung vào học
ngoại ngữ. Trước khi tốt nghiệp ở trường mình, anh nhận được hai học bổng: một
ở bên Nhật, và một ở Hà Lan. Hồi đó anh nghĩ là Hà Lan hay hơn vì anh thích đi
đâu đó thật xa, đến một nền văn hoá mới lạ để tìm hiểu và quan sát. Cho đến giờ
thì anh không thất vọng với quyết định này của mình.
Hà
Lan rất mạnh về trí tuệ nhân tạo và máy học. Hiện nay Amsterdam đang trở thành
trung tâm nghiên cứu khoa học về trí tuệ nhân tạo của Châu Âu và thế giới. Cộng
với môi trường kinh doanh rất rành mạch và cởi mở, Amsterdam thu hút rất nhiều
những công ty công nghệ lớn (ebay, Google,
Bosch đều đã có trụ sở văn
phòng công nghệ và nghiên cứu ở đây) và các công ty startup cũng rất nhiều (Ví
dụ: booking.com, Adyen).
- Anh có thể nhận xét một chút về môi trường sống và làm việc, cũng như các
cơ hội học tập( đại học và cao học) của Hà Lan so với Việt Nam được không ạ?
Cơ
hội học tập ở Hà Lan là khá nhiều cho các bạn sinh viên Việt Nam. Tháng 9 hàng
năm vợ chồng anh tổ chức một bữa tiệc để chào đón các bạn sinh viên Việt Nam
mới sang Hà Lan. Qua đây anh thấy số lượng các bạn sang ngày càng nhiều.
Môi
trường đại học và cao học của Hà Lan rất mở. Sinh viên có nhiều tự do trong
việc lựa chọn những môn học mình muốn. Tương tác giữa các sinh viên với giáo sư
rất bình đẳng. Sinh viên luôn luôn chủ động đặt câu hỏi cho bạn bè và giáo sư.
Cơ
hội việc làm ở Hà Lan cho các bạn học về công nghệ thông tin nói chung, và khoa
học dữ liệu nói riêng, là cao. Nền công nghệ thông tin của Hà Lan rất phát
triển, nhưng cũng đang rất thiếu nguồn nhân lực trong lĩnh vực.
Cuộc sống ở Hà Lan rất thanh bình. Người dân rất tập trung vào sự cân bằng giữa
công việc và chất lượng cuộc sống.
Ở vườn hoa
Keukenhof.
- Cuối cùng, anh có thể các bạn sinh viên một lời khuyên sau chốt được không ạ?
Các
bạn sinh viên nên xác định cho mình lĩnh vực học mà mình thực sự mong muốn và
yêu thích nó. Thế giới hiện nay rất mở, khi các bạn đã xác định được những gì
mình thích học và thích làm, sẽ có rất nhiều cơ hội để các bạn tìm hiểu và nâng
cao kiến thức của mình.
- Em rất cảm ơn anh về buổi phỏng vấn này, chúc anh thành công hơn trong công
việc và cuộc sống ạ.