Pages

Monday, November 4, 2019

Nhật ký đi làm

Ngày đầu đi làm, sau khi nhận thẻ nhân viên và điện thoại từ  phòng hành chính, tôi được dẫn lên phòng làm việc ở tầng 18 của toà nhà Garden Air Tower, ở quận Chyoda, Tokyo. Văn phòng làm việc khác xa so với những gì tôi đã nghĩ về một trung tâm nghiên cứu. Đó là một văn phòng lớn gồm nhiều dãy bàn kê song song. Ở đầu mỗi dãy là bàn làm việc của quản lý. Điều làm tôi ngạc nhiên nhất là không hề có vách ngăn giữa các dãy hay giữa có bàn làm việc. Bàn làm việc của tôi nằm ở chính giữa, bên trái tôi là một nhân viên người Trung đã làm việc được 4 năm. Bên phải là các 派遣社員, các nhân viên đến từ các công ty khác để trợ giúp công việc cho chúng tôi. Họ đều là những nhân viên đã khá lớn tuổi, chắc phải trên 50. Ngồi đối diện tôi là một người Nhật, chuyên về các hệ thống quản lý dữ liệu. Nhóm tôi còn có hai người Nhật nữa.
Ngồi vào bàn, đang cài đặt máy tính thì tôi được thông báo vào họp. Đây là một trong hai buổi họp hàng tuần của nhóm tôi. Nội dung chính là cập nhật lại tình hình làm việc của nhóm. Vì là hôm đầu tiên tôi đến nên quản lý của tôi cũng tham gia.
Buổi trưa được nghỉ một tiếng, tôi đi ăn trưa ở một cửa hàng mỳ ở gần công ty. Ăn uống xong, tôi quay lại làm việc. Giờ làm việc là từ 9h sáng đến 5 rưỡi chiều, nhưng đến giờ mà tôi không thấy ai về cả. Làm việc tiếp đến 8h thì công ty phát loa thông báo là mọi người sắp xếp công việc rồi về trước 8h. Lúc này mọi người mới dọn dẹp đồ đạc rồi ra về. Tôi cũng thu dọn hành lý, chào những người đang còn ở lại, rồi đi bộ về phòng trọ cách công ty khoảng 2Km.

Tuần đầu tiên tôi chủ yếu ngồi học về các hệ thống của công ty, đăng ký tài khoản, và mua thiết bị làm việc. Những việc này cậu bạn người Trung giúp tôi rất nhiệt tình. Nhìn vào lịch làm việc của anh trưởng nhóm, tôi tự hỏi không biết anh lấy thời gian đâu mà làm nghiên cứu nữa. Mỗi ngày anh đều phải tham gia 4 đến 5 cuộc họp, mỗi cái phải một tiếng. Tôi chỉ thỉnh thoảng thấy anh ngồi ở bàn làm việc. Các nhân viên như tôi ít hơn, một tuần chỉ có từ 3 đến 4 cuộc họp. Còn đến mức quản lý thì khỏi phải nói, đi họp cả ngày. Ở công ty tôi, thứ 4 là ノー残業デー, tức là ngày không làm thêm. Ngày này, đến 5 rưỡi chiều là sẽ có loa thông báo bảo mọi người về. Thực tế là tôi không thấy ai về lúc 5 rưỡi chiều cả, vẫn đến 8h thì mọi người mới ra về.
Hàng ngày tôi về đến nhà khoảng 9h tối, ăn uống rồi tắm rửa dọn dẹp xong cũng đến 10 rưỡi, 11h tối. Những người đi làm xa thì chắc còn muộn hơn. Thế này tôi càng hiểu rõ là ở Nhật, nếu lập gia đình và có con, thì một trong hai người phải ở nhà. Vì nếu không thì không có ai chăm con cả. Trên đường đi làm về tôi gặp rất nhiều bà mẹ đón con bằng xe đạp, thỉnh thoảng còn thấy con đạp xe theo sau, chắc là đứa lớn hơn.

Những khó khăn luôn xuất hiện khi chuyển môi trường làm việc. Phần tới tôi sẽ mô tả rõ hơn về làm nghiên cứu ở KDDI Research.

Sunday, October 13, 2019

New conference paper

Our latest work on adaptation for cloud gaming under constrained resources has been accepted for presentation at 26TH INTERNATIONAL CONFERENCE ON MULTIMEDIA MODELING. (Link)
Cloud gaming has emerged as a new trend in the gaming industry, bringing a lot of benefits to both players and service providers. In cloud gaming, it is essential to ensure low end-to-end delay for good
use experience. Hence, sufficient computational resources must be available at the client in order to process video in a timely manner. However, thin clients such as mobile devices generally have limited computation capabilities. Thus, the available computational resources may be insufficient to support the client, such as in case of low battery. In this paper, we propose a new adaptation framework for resource-constrained cloud gaming clients. The proposed framework combines frame skipping at the server and frame discarding at the client according to available computational resources of the client. Experiment results show that the proposed framework can significantly improve video quality given a delay constraint compared to conventional methods.


Malaysia du ký


Tôi đến Malaysia vào buổi chiều cuối tháng 9. Sau khi ra khỏi sân bay quốc tế Kuala Lumpur (KLIA), tôi mua sim điện thoại và đi tàu về khách sạn. So với sân bay Suvarnabhumi ở Bangkok thì sân bay này không đông đúc bằng. Thủ tục hải quan ở đây cũng không có gì phức tạp vì tôi có hộ chiếu Việt Nam. Mất khoảng 1 tiếng để đi tàu từ sân bay về trung tâm Kuala Lumpur. Lúc đang loay hoay mua vé tàu điện ngầm để đi tiếp, có một ông già khoảng tầm 60 tuổi người địa phương ra hỏi là đi đâu bằng tiếng Trung. Mình lắc đầu, thế là ông chuyển sang tiếng Anh. Cho ông xem thông tin điểm đến thì ông bảo là mua nhầm vé rồi, nhưng có thể đến quản lý ở điểm ra cuối cùng để trả thêm tiền. Ông còn dặn rất kỹ là phải đi tàu số mấy để đúng hướng.
Tôi cảm ơn ông rồi xuống tàu điện ngầm. Hệ thống tàu điện ngầm ở Malay rất mới và hiện đại. Các bảng chỉ dẫn hay thông báo trên tàu đều có tiếng Anh nên không sợ bị xuống nhầm. Lên khỏi mặt đất, điều đầu tiên tôi nghe thấy là đọc kinh vọng ra từ một nhà thờ hồi giáo rất lớn gần đấy. Trên đường thì phần lớn là xe ô tô, chỉ có một số ít xe máy. Đến gần khách sạn, hai tòa tháp đôi Petronat cao lừng lững và sáng bừng hiện ra trước mặt, quả thực là rất ấn tượng. Sau khi nhận phòng khách sạn, tôi ra ngay phố ẩm thực Jalan Alor ở gần đấy ăn tối. Không khí ở Jalan Alor rất náo nhiệt lúc tôi đến, các hàng quán thay nhau mời khách. Ở đầu phố là các quán bán rất nhiều các loại hoa quả nhiệt đới, xoài, mít, khế, dưa hấu, và tất nhiên là không thể không nhận ra mùi đặc trưng của sầu riêng. Ở giữa phố là các quán bán đồ ăn, các món ăn cũng không khác bên Việt nam mình nhiều, từ các món xào, rán, rồi hải sản, chủ yếu để phục vụ khách du lịch. Các biển hiệu thì đều viết bằng tiếng Trung, cùng với đèn lồng đỏ chăng dọc các lối đi, với tôi đây giống như là phố Trung hoa hơn J Sau khi đi một vòng, chúng tôi chọn một quán có vẻ đông khách, vào gọi một đĩa cơm rang và một bát phở. Đĩa cơm rang ăn rất hợp nhưng bát "phở" thì tôi không thích mùi của nó lắm. Bánh phở giống bánh cuốn bên mình, nhưng nước phở thì đặc và ngậy, vì có thịt lợn băm ở trong.

Ngày thứ hai ở Kuala Lumpur, tôi ra một cửa hàng bình dân ở gần khách sạn ăn sáng. Thực đơn của quán này có các món mỳ xào và đồ ăn theo kiểu Ấn. Tôi gọi một món tên là Apam balik, một loại bánh rán ăn kèm với cà ri. Bánh được rán mỏng như giấy và cuộn tròn lại. Tôi thích đồ rán nên rất khoái món này. Cà ri có ba vị để thưởng thức. Đã xác định trước là chủ yếu khám phá ẩm thực, tôi gọi Uber để đi đến một địa điểm nổi tiếng với món cà ri đầu cá. Quán này ở khá xa trung tâm, lúc tôi đến đấy thì mọi người đang xếp hàng dài. Đến nơi tôi vào xếp hàng thì nhìn thấy mọi người ở đây đang ăn nhưng không thấy ai ăn đầu cá cả, mọi người chủ yếu ăn gà rán hoặc cá rán với cơm và cà ri, những người bản địa thì họ ăn bằng tay. Xếp hàng khoảng 15 phút, đến nhìn tận nơi chỗ bán thì chả thấy đầu cá đâu cả, thế là đành đi về. Hơi tiếc một chút L Đến tối, tôi đi đến chỗ tòa tháp đôi Petronat. Dọc đường đi là rất nhiều các nhà cao tầng và các trung tâm mua sắm lớn, các cửa hàng bán lẻ Seven Eleven. Ngay dưới chân của tòa tháp đôi cũng là một trung tâm mua sắm, bán đủ các loại hàng hóa. Có rất nhiều các cửa hàng của các hãng thời trang, nước hoa, đồng hồ nổi tiếng thế giới, nhưng chả mấy khi thấy có khách vào. Tòa tháp đôi nhìn gần thật hoành tráng, sáng chói. Rất đông du khách và người địa phương tập trung ở đây để chụp ảnh. Từ những người chụp ảnh bằng điện thoại, cho đến những người có cả nhiếp ảnh gia đi cùng. Một không khí náo nhiệt giữa trung tâm Kuala Lumpur. Tôi quyết định đi xe buýt để về khách sạn xem thế nào. Ra đứng đợi ở trạm bus khoảng 10 phút thì thấy xe đến, nhưng xe không dừng mà đi thẳng luôn. Ngẩn tò te không hiểu thế nào, chắc mẩm là xe này nó về bến hay đại loại gì đấy, nên thôi đợi xe sau vậy. Khoảng 10  phút sau xe lại đến, và cũng như lần trước, xe đi thẳng. Thế là quyết định bỏ cuộc, gọi uber rồi về khách sạn.

Ngày thứ ba, chúng tôi đi đến một quán ăn tên là Restoran Rebung Dato Chef Ismail, nghe nói quán này bán những đồ ăn đặc trưng của Malay. Xuống xe thì thấy biển hiệu nhưng không thấy cửa vào đâu, chỗ vào thì chỉ là chỗ đỗ ô tô. Đi lòng vòng một lúc thì mới phát hiện ra là quán này nó ở tầng 5, mà chỗ lên thang máy lại ở trong chỗ đỗ ô tô. Lên đến nơi thì thấy rất nhiều thức ăn đã được dọn theo kiểu buffet. Trên bàn lại còn ghi tên, hóa ra chỗ này cần đặt trước. Hỏi nhân viên ở đó thì họ dẫn ra bàn ở phía ngoài dành cho khách không đặt trước. Thức ăn ở đây được nấu rất ngon và đa dạng, từ các loại bún, đến cơm, cá rán, cari, đồ tráng miệng. Lần trước ở Thái tôi gặp được món xôi xoài thì lần này ở Malay tôi lại được ăn một món mới mà rất ấn tượng: Chè nếp cẩm. Nếp nấu mềm, chè ngọt vừa phải, cộng với vị thơm của nước dừa. Ở Việt Nam tôi chưa được ăn món này bao giờ. Ngoài ra, bún ở đây nấu cũng rất ngon. Dù trời hơi nóng và ở xa trung tâm, chuyến đi quán Shef Mali này đúng không bõ công tý nào. Buổi chiều, chúng tôi đi thăm bảo tàng quốc gia Malaysia. Lịch sử hình thành cũng như phát triển của đất nước này được trình bày rất dễ hiểu, từ thời cổ đại cho đến hiện đại. Nó cũng giải thích cho tôi về sự đa dạng văn hóa ở đất nước này mà tôi vẫn bắt gặp trên đường phố. Malaysia với eo biển Mallaca là một trong những eo biển tấp nập nhất thế giới, thương nhân từ khắp nơi trên thế giới đều đi qua đây. Rất nhiều người trong số đó ở lại sinh sống, tạo nên một nền văn hóa đa dạng từ người Mã, Người gốc Trung, gốc Ấn.
Chuyến đi Malaysia dù ngắn ngày nhưng với rất nhiều trải nghiệm, đặc biệt là văn hóa ẩm thực. Hy vọng sẽ có cơ hội quay lại một lần nữa.

















Sunday, October 6, 2019

Nhật ký xin việc (kỳ 2)


Với sinh viên tốt nghiệp tiến sỹ thì sau khi tốt nghiệp sẽ có 4 hướng xin việc chính:
1. Giáo sư ở trường đại học
Sau khi nhận được bằng PhD, bạn có thể apply vào làm giáo sư ở các trường đại học. Thông thường yêu cầu khi tuyển giáo sư khá cao so với các sinh viên mới tốt nghiệp, đặc biệt là yêu cầu về kinh nghiệm làm việc cũng như giảng dạy. Hồ sơ đăng ký ngoài sơ yếu lý lịch, thành tích nghiên cứu, thì thường sẽ yêu cầu viết một bản kế hoạch về nghiên cứu (research plan) và giảng dạy (teching plan). Một số trường còn yêu cầu nộp đề cương của các môn học bạn đã từng dạy. Quá trình tuyển dụng sẽ bao gồm vòng hồ sơ và phỏng vấn. Mình đã từng nộp hồ sơ vào trường Waseda nhưng không qua được vòng hồ sơ. Theo mình thì việc được nhận vào làm giáo sư ngay sau khi tốt nghiệp ở thời điểm hiện tại là cực kỳ khó. Tuy nhiên, các bạn nên thử vì cũng không mất gì nhiều J.  Thông tin tuyển dụng các bạn có thể tìm thấy trên các trang web như Linkedin, JREC (chuyên jobs cho PhD), ResearchGate, etc.
2. Postdoc
Đây là một hướng mà nhiều tiến sỹ sau khi tốt nghiệp lựa chọn, đặc biệt là những người muốn phát triển trong môi trường academic. Ở lab mình, anh Vương và Thành đi theo hướng này. Khi làm postdoc, bạn sẽ tham gia vào làm dự án với giáo sư ở các trường đại học. Công việc chủ yếu vẫn là làm nghiên cứu như trong thời gian làm PhD. Trong thời gian làm PostDoc, bạn có thể mở rộng kết nối cũng như có thêm publications để tìm việc tiếp theo. Thời gian làm postdoc thì phụ thuộc vào dự án cũng như giáo sư. Thông tin về các vị trí postdoc có thể tìm thấy trên rất nhiều trang tuyển dụng như Linkedin, JREC, Research Gate, etc.
3. Researcher ở các viện nghiên cứu hay các công ty
Các viện nghiên cứu quốc gia như NICT, NII, JAIST cũng là nơi mà bạn có thể apply xin việc vào sau khi tốt nghiệp. Anh Phúc là người đi theo hướng này. Theo mình biết, thì các viện nghiên cứu cũng tuyển người theo dự án từ 3-5 năm. Các viện nghiên cứu lớn thường sẽ tập trung vào các công nghệ cho tương lai, chuẩn (standard), etc.
Các công ty công nghệ lớn như NTT, KDDI, Rakuten, Toshiba, Yahoo Japan đều có các lab nghiên cứu cần tuyển tiến sỹ. Mục tiêu chính của các lab này là phát triển công nghệ phục vụ cho công ty mẹ.  Các dự án nghiên cứu vì vậy cũng khác hơn so với ở các viện nghiên cứu quốc gia cũng như trong trường đại học. Trọng tâm là phát triển các công nghệ để tạo lợi ích cho công ty, vì vậy việc có publications sẽ khá hạn chế. Ngoài ra, bạn có thể sẽ phải làm việc trực tiếp với khách hàng và cải thiện dịch vụ cho họ. Hiện tại, chỗ mình làm (KDDI Research Inc.) hoạt động theo mô hình này. Tất nhiên là việc làm thiên về hướng nào sẽ phụ thuộc vào bộ phận bạn xin vào nữa.
4. Engineer
Nếu các bạn muốn phát triển các sản phẩm thực tế thì có thể xin tuyển vào các vị trí kỹ sư ở các công ty. Bạn có thể apply vào rất nhiều công ty, từ mức start-up đến các tập đoàn lớn. Anh Hưng ở lab mình là người theo hướng này. Với mức độ phát triển công nghệ nhanh như hiện nay, làm việc ở các công ty cũng là một môi trường rất lý tưởng cho những người đam mê công nghệ. Các công ty công nghệ lớn ở Nhật như Line, Yahoo Japan, hay Google Japan cũng đang cần tuyển những người có bằng PhD. Các bạn có thể tìm kiếm thông tin tuyển dụng trên trang Linkedin.
Trên đây là bốn hướng nghề nghiệp chính cho các sinh viên PhD sau khi tốt nghiệp. Về việc làm hồ sơ cũng như chọn công ty để apply thì mình có một số lời khuyên như
- Gửi hồ sơ đến càng nhiều công ty càng tốt (Mình apply khoảng ~20 công ty). Theo kinh nghiệm của mình thì sẽ chỉ có một nửa các công ty xem xét hồ sơ của bạn. Trong số đó, cũng sẽ chỉ có một nửa số cty gọi bạn đi phỏng vấn. Và cuối cùng sẽ chỉ có 1-2 công ty offer jobs cho bạn.
- Bạn không nên quá quan trọng việc chọn job để apply, như thế sẽ bỏ qua rất nhiều cơ hội. Nên mở rộng phạm vi tìm kiếm. Vì thông thường công việc bạn làm sẽ không giống như những gì bạn làm trong thời gian làm PhD. Chỉ cần có một chút liên quan là có thể apply được.
- Về hồ sơ tuyển dụng, bạn nên mô tả các kỹ năng (skills) của mình một cách hợp lý. Tránh dùng các keywords trong academic papers J. Bạn nên tìm hiểu kỹ về mô tả công việc mình chuẩn bị apply và điều chỉnh CV một cách phù hợp.
- Phỏng vấn là một trong những giai đoạn quan trọng nhất trong quá trình tuyển dụng. Với các ứng viên là PhD, bạn sẽ được yêu cầu trình bày 1) các kết quả nghiên cứu bạn đã làm và 2) hướng nghiên cứu trong tương lai. Phần 1) là phần quan trọng hơn vì đây là nơi người phỏng vấn sẽ xem xét năng lực trình bày vấn đề và communication skils của bạn. Thông thường, những người phỏng vấn sẽ có rất ít kiến thức về vấn đề bạn đang làm. Nên điều quan trọng là bạn phải giải thích được vấn đề một cách dễ hiểu, cũng như giải đáp thắc mắc của người nghe một cách cẩn thận và đầy đủ.
- Về trang phục, bạn nên mua một bộ vest dành riêng cho đi xin việc. Ở Aizu, bạn ra Aoyama là mua được ngay.
- Về các bài kiểm tra kỹ năng (thường là logic và programming), bạn có thể lên các trang web online để luyện tập. Với các ứng viên PhD, thường sẽ chỉ có phần kiểm tra logic.
- Về thời gian tuyển dụng, mùa tuyển dụng bắt đầu từ tháng 3 và kéo dài khoảng 5-6 tháng. Ngoài ra các công ty cũng đăng thông tin tuyển thường xuyên trên các trang tuyển dụng. Cuối năm thứ 2 là thời điểm thích hợp để bạn tìm hiểu và chuẩn bị cho quá trình xin việc.

Sunday, July 28, 2019

Giới thiệu về hài Nhật Bản


Phần lớn tiếng Nhật tôi học được là từ việc xem các chương trình Tivi, đặc biệt là các chương trình hài. Hồi mới sang Nhật, có một bạn sinh viên đến từ Srilanka hỏi tôi có biết ダウンタウン (Downtown) không. Tôi trả lời là không và được bạn kia cho biết đây là một nhóm hài nổi tiếng với các tiểu phẩm rất thú vị. Từ đó tôi bắt đầu lên YouTube tìm xem về hài Nhật Bản. Hồi đầu nghe thì gần như không hiểu gì nhưng thấy cách gây cười thì rất lạ, khi một người nói xong thì người còn lại đánh vào đầu người này và nói một câu gì đó, rồi khán giả cười nghiêng ngả. Tìm hiểu ra thì đây là một trong các cách diễn hài phổ biến nhất ở Nhật, được gọi là "Manzai". Một nhóm hài sẽ thường có hai người gọi là konbi (コンビ), một người được gọi là boke (ボケ) phụ trách nói những câu gây cười, người còn lại được gọi là Tsukomi (ツッコミ) phụ trách việc chỉ ra những lỗi sai, điều vô lý trong câu nói của boke.

Trong Manzai, các nghệ sĩ sẽ không sử dụng đạo cụ hay hóa trang, họ sẽ chỉ mặc vest, đứng trước micro và diễn trước mặt khán giả. Mỗi nhóm hài ở Nhật có một cách gây cười đặc trưng, và sẽ chỉ dùng cách này trong gần như tất cả các tiết mục. Một trong số đó là ナイツ, boke của nhóm này sẽ cố tình nói sai các từ và câu để gây cười. Trong tiểu phẩm [1], boke vào đề bằng việc cố tình nói nhầm câu "Nhìn tôi thế này nhưng rất thích karaoke"「私はこう見えても、カラオケが大好き。」 thành 「私は肛門見えても、。。」để gây cười vì cách phát âm rất giống nhau. Các nhóm hài sẽ không được phép sử dụng cách gây cười đặc trưng của nhóm khác. Mỗi tiết mục Mazai sẽ kéo dài 4-5 phút, những cũng có những thể loại ngắn hơn từ 2-3 phút. Hàng năm ở Nhật đều tổ chức một cuộc thi Manzai cho các nhóm hài tranh tài gọi là M-1グランプリ. Phần thưởng dành cho đội vô địch sẽ là 1000 man yên và một chương trình tivi riêng.

Một cách diễn hài phổ biến khác là Konto (コント), tức là các tiểu phẩm hài. Trong Konto, các nghệ sĩ hài sẽ hóa thân thành các nhân vật khác nhau trong một câu chuyện trong một bối cảnh nhất định. Cũng như Manzai, mỗi nhóm hài sẽ có một phong cách đặc trưng riêng. Một trong những nhóm mà tôi rất thích là アンジャッシュ với các tiểu phẩm 勘違いコント nơi hai nhân vật nói chuyện với nhau nhưng mỗi người đều hiểu nhầm cái người còn lại đang nói, nhưng vẫn ăn khớp để câu chuyện của mỗi người vẫn tiếp tục. Trong tiểu phẩm [2], một anh chàng đến phỏng vấn xin việc ở một cửa hàng đang ngồi trong phòng đợi. Cùng lúc đó, ông xếp của cửa hàng nhận được một cuộc điện thoại về việc có một tên ăn trộm ở cửa hàng bị bắt. Ông xếp bước vào phòng mà nghĩ rằng người đến phỏng vấn chính là tên trộm. Ông liên tục tra khảo anh chàng bằng những câu hỏi như: Đây là lần đầu tiên mày làm việc này phải không? Anh chàng thật thà trả lời là tôi đã từng làm việc này nhiều lần ở nhiều cửa hàng khác (:D), bởi vì nghĩ là ông này hỏi về kinh nghiệm làm việc. Tiểu phẩm cứ tiếp tục với liên tục những câu hỏi và câu trả lời của hai người hiểu nhầm nhau.

Ngoài Manzai và Konto, còn có nhiều thể loại hài khác như Oogiri (大喜利), Rakugo (落語), Monomane (物真似). Mỗi loại hình đều có những đặc trưng riêng sẽ được giới thiệu trong phần tiếp theo.


[1] https://www.youtube.com/watch?v=gafDcDSrmkk
[2] https://www.youtube.com/watch?v=HUr4J8kX4cI


Sunday, July 21, 2019

New conference paper (IEEE MMSP 2019): Scalable 360 Video Streaming using HTTP/2

My latest work on 360-degree video streaming over network has been accepted for presentation at IEEE MMSP 2019.  This paper is a result of my collaborative research with Prof. Truong Thu Huong of HUST and Prof. Pham Ngoc Nam of Vin University.

Overview

360-degree video is a main content type in Virtual Reality, providing users with immersive viewing experience. In this paper, we propose a novel adaptation method for 360-degree video streaming over HTTP/2, which can provide high viewing experience to users under time-varying network conditions and time-varying user head movements. The proposed method utilizes Scalable Video Coding to solve the trade-off between network adaptivity and user adaptivity. An optimal tile layer selection
algorithm is provided. To cope with sudden throughput drops, the delivery of late layers are terminated using HTTP/2’s stream termination feature. Also, a tile layer updating scheme is proposed to deal with viewport estimation errors. Experimental results show that the proposed method can improve the average viewport bitrate by 16-17% compared to a reference method.

Key features

  • Scalable Video Coding (SVC) is utilized to tackle the trade-off between network adaptivity and viewport adaptivity.
  • The tile layer selection problem is formulated and an efficient algorithm is proposed.
  • A late tile layer termination scheme is presented that can save network resources by terminating the delivery of late tile layers using HTTP/2’s stream termination feature.
  • A tile layer updating scheme that can effectively deal with viewport estimation errors is proposed. The scheme makes use of HTTP/2’s stream priority feature.
Future work

In future work, our goal is to further improve the user experience by providing both temporally and spatially smooth viewport quality. 

Saturday, July 20, 2019

Book review: Quy tắc của Google


Giống như tất cả các công ty công nghệ lớn, Google rất chú trọng vào việc tuyển dụng và quản lý nguồn nhân lực. Quyển sách này được viết bởi Laszlo Bock, phó chủ tịch nhân sự cấp cao của Google, nhằm giới thiệu những đặc trưng về vấn đề nhân sự tại Google.

Về việc tuyển dụng, phương châm chính là không thỏa hiệp về bất cứ điều gì cho chất lượng. Sẽ chỉ có những người xuất sắc và có khả năng phát huy khả năng ở Google mới được tuyển. Ở đây, yếu tố quan trọng là kỹ năng giải quyết vấn đề và khả năng làm việc nhóm. Google tin rằng tuyển một nhân viên không phù hợp sẽ gây tác hại lớn hơn nhiều so với việc chờ đợi để tuyển được một nhân viên xuất sắc. Quá trình tuyển dụng thường kéo dài 6-8 tháng, và các ứng viên sẽ phải trải qua khoảng 20 cuộc phỏng vấn. Mỗi một ứng viên sẽ được phỏng vấn bởi các nhà quản lý, các giám đốc, đồng nghiệp, và cả cấp dưới tương lai. Việc đánh giá này sẽ tránh được các định kiến cũng như việc nâng đỡ cho người thân quen. Các biên bản đánh giá của tất cả các người phỏng vấn sẽ được tổng hợp và tính ra điểm cho từng ứng viên. Một trong các tiêu chí quan trọng cho những người tham gia tuyển dụng là "chỉ tuyển những người giỏi hơn mình".

Về việc đánh giá hiệu quả công việc, Google trao quyền cho đám đông và các công cụ. Cụ thể, các nhân viên sẽ được đánh giá không chỉ bởi người quản lý mà còn bởi các đồng nghiệp trong cùng nhóm bằng hình thức nặc danh. Hiệu quả công việc sẽ được cho điểm số và đó là căn cứ để xem xét việc thăng chức hay tăng lương, thưởng. Các nhà quản lý cũng được các nhân viên đánh giá và xếp hạng theo cách thức tương tự. Những người hoàn thành xuất sắc công việc của mình sẽ truyền đạt kinh nghiệm của mình cho những người khác thông qua các chương trình học tập trong công ty. Những nhân viên nằm ở 10% thấp nhất công ty sẽ được hướng dẫn để cải thiện thành tích của bản thân. Tất nhiên, với những người liên tục nằm ở đáy của bảng xếp hạng, họ sẽ bị sa thải. Để tìm ra cách đánh giá hiệu quả nhất, Google mở một phòng nghiên cứu về hoạt động con người (PiLab) bên trong công ty. PiLab sẽ đề xuất, thử nghiệm, và cải tiến liên tục cách thức đánh giá dựa trên phản hồi của các nhân viên trong công ty.

Về việc giúp nâng cao hiệu quả công việc cho từng cá nhân, các checklist được sử dụng. Ví dụ, với các nhân viên mới, họ sẽ được gửi một email trong đó có danh sách các việc nên làm để đạt được đến hiệu quả công việc tối đa trong thời gian ngắn nhất. Danh sách này bao gồm các việc như đặt càng nhiều câu hỏi càng tốt, chủ động giao tiếp với quản lý và các đồng nghiệp bằng việc mời ăn trưa, v.v. Nghe có vẻ là những việc rất hiển nhiên nhưng Google chỉ ra rằng các danh sách này rất hữu ích. Các nhân viên được khuyến khích mở các lớp dạy về những kỹ năng của mình cho các nhân viên khác trong công ty. Việc trao đổi giữa các nhân viên thuộc các phòng ban khác nhau được khuyến khích. Ví dụ, các nhà ăn trong công ty sẽ được thiết kế để người từ nhiều bộ phận sẽ có cơ hội ngồi cạnh nhau.

Về việc chia sẻ thông tin trong công ty, Google khác với Apple ở chỗ thông tin về các dự án, sản phẩm sẽ được chia sẻ đến tất cả mọi nhân viên trong công ty. Ở Google, sự chia sẻ và tính minh bạch trong công việc được đề cao, nhằm mục đích hướng đến một môi trường làm việc tự do. Hàng tuần, sẽ có một cuộc họp toàn thể công ty nơi mọi nhân viên có thể đặt câu hỏi cho CEO. Nhân viên cũng có thể gửi thư góp ý đến các quản lý và lãnh đạo về mọi vấn đề mà họ thấy bất hơp lý. Một trường hợp tiêu biểu là khi trong thực đơn của nhà bếp có một món tên là "bánh Tây Tạng tự do", một số nhân viên đã gửi mail đến ban lãnh đạo yêu cầu giải thích về vấn đề này. Nguyên nhân là do Trung Quốc vẫn xem Tây Tạng là một phần của mình, do vậy việc đặt tên món ăn như vậy là không thích hợp theo quan điểm của một số người. Cuối cùng, tác giả cuốn sách đã phải đứng ra dàn xếp bằng việc thay đổi tên món ăn. Tự do đưa ra ý kiến là một đặc trưng trong văn hóa Google.

Về việc trả lương, Google sẽ trả lương dựa trên đóng góp của một Googler cho công ty. Nếu bạn đưa ra được những giải pháp tuyệt vời đem lại hiệu quả cao, bạn có thể nhận lương gấp hàng chục, thậm chí hàng trăm lần lương của đồng nghiệp cùng vị trí. Và lương của bạn sẽ tiếp tục tăng theo sự đóng góp, chứ không bị một hạn chế cụ thể nào. Đây là chính sách nhằm giữ những người xuất chúng ở lại đóng góp cho Google. Điều này cũng giống như trong bóng đá, khi những ngôi sao xuất sắc nhất nhận lương gấp hàng trăm lần những cầu thủ mức trung bình.

Kết: Google cố gắng tạo ra một môi trường cho các cá nhân đưa ra ý kiến và phát huy tính sáng tạo ở mức cao nhất. Nhằm quản lý nhân sự một cách tốt nhất, PiLab liên tục nghiên cứu và đưa ra các thử nghiệm để ngày càng cải thiện mô hình quản lý của Google. Các giải pháp tốt sẽ được triển khai tới toàn công ty, trong khi những giải pháp không phù hợp sẽ bị loại bỏ. Các hạn chế sẽ được khắc phục dựa trên trải nghiệm của các Googler. Một quá trình "trial and error" liên tục. Điều này giúp cho Google luôn được biết đến là nơi có môi trường làm việc thuộc vào loại tốt nhất trên thế giới.

Tuesday, June 25, 2019

Thái lan du ký


Tôi đến Thái Lan vào một ngày giữa tháng 6. Sân bay Bangkok Suvarnabhumi rất đông đúc, tôi mất khoảng 1 tiếng để làm thủ tục hải quan và lấy hành lý.  Sau đó, tôi đến quán ăn tên là Magic Food Court ở ngay tầng 1 của sân bay để ăn trưa trước khi về khách sạn. Đường sắt trên cao nối liền sân bay và trung tâm thành phố nên tôi có thể nhìn được toàn cảnh Bangkok từ trên tàu. Cảm nhận đầu tiên của tôi là có rất nhiều khu nhà cũ, bị bỏ hoang đan xen giữa những khu nhà cao tầng. Cảm giác như không có sự phát triển nào từ lâu lắm rồi. Trên đường là hàng dài xe ô tô mà phần lớn là xe taxi với đủ màu sắc. Vì sau khi xuống tàu tôi phải đi taxi về khách sạn nên tôi nhìn xem loại taxi nào phổ biến. Tôi thấy loại taxi màu xanh vàng phải chiểm hơn một nửa số taxi tôi nhìn thấy trên đường, tôi nghĩ đây chắc là hãng taxi phổ biến ở đây. Càng tiến vào trung tâm Bangkok, số nhà cao tầng cũng ngày càng tăng nhiều, có vẻ như khu trung tâm phát triển hơn vùng ngoại ô rất nhiều.

Xuống tàu ở ga Phaya Thai, tôi bắt xe taxi để đi về khách sạn. Chúng tôi bắt một taxi ở gần cửa ga sau khi chứng kiến một đoàn tàu chờ người đi bộ qua đường hết mới đi tiếp. Tôi cũng thấy có một cửa hàng seven eleven ở ngay cạnh ga tàu. Trước khi đến Bangkok, một người bạn từ thái lan đã nhắc chúng tôi chỉ nên lên taxi nào có bật meter. Để tránh bị chèn ép giá, chúng tôi đã đi xa 1 đoạn cách nhà ga. Khi thấy một chiếc taxi đang đỗ bên đường có màu xanh vàng với biển ghi chữ “taxi-meter” ở trên nóc. Cửa xe mở ra, tôi đưa địa chỉ khách sạn cho người lái xe, anh ta xem một lúc rồi bảo 500 bạt (~350 nghìn). Chúng tôi có yêu cầu bật meter, nhưng anh ta không đồng ý. Như vậy là không có bật meter gì cả L. Tôi biết giá như thế cũng là quá cao so với khoảng cách chỉ hơn 8Km tới khách sạn, nhưng vì mọi người đều mệt nên chúng tôi chấp nhận và lên xe. Đến giờ chúng tôi mới nhận ra là lúc đấy chúng tôi đã bắt taxi trước 1 khách sạn. Điều này khiến giá taxi cao hơn và không yêu cầu được họ mở meter. Đường phố Bangkok rất đông nên phải mất hơn 30 phút chúng tôi mới về đến khách sạn. Phòng khách sạn khá rộng rãi, tôi cất dọn hành lý sau đó đi ăn ở quán Kura Apron. Quán ăn này do một bạn người Thái giới thiệu, quán khá sạch sẽ, có điều hòa, giá cả phải chăng, thức ăn rất phù hợp với người nước ngoài. Tôi đọc thông tin, thì quán do 5 chị em mở. Có một người tên là Aunty Dang là người đã nấu cho hoàng gia ăn.

Ngày thứ hai ở bang kok, chúng tôi đi thăm cung điện hoàng gia và khu chùa lân cận. Chỗ chúng tôi ở gần nên đi bộ là có thể đến nơi được. Thời tiết ở bang kok rất nóng, khoảng 35-36 độ. Các quán ăn nhỏ có rất nhiều ở hai bên các con đường nhỏ, bán các loại cơm bình dân, phở. Nhìn qua thì tôi thấy rất nhiều món nướng mùi rất thơm, giống như ở Hà nội. Ở chỗ dừng đèn đỏ, tôi còn thấy rất nhiều sóc trên cây bên đường, chúng thoăn thoắt chuyền giữa các cành cây, giờ tôi mới thực sự hiểu câu “nhanh như sóc”. Dọc đường đi đến cung điện có rất nhiều cây me, vỉa hè đường phố rất sạch sẽ, và trước phần lớn các tòa nhà đều treo ảnh của vua Rama X, vị vua đang trị vì của thái lan, cũng như các thành viên trong hoàng tộc. Màu vàng và tím có vẻ như là màu của hoàng gia thái lan, vì tôi thấy hai màu này là màu chủ đạo để trang trí xung quanh các bức ảnh. Chỗ tôi đến đầu tiên là Grand Place, đây là nơi ở trước đây của nhà vua, hiện nay biến thành địa điểm du lịch. Grand Place là một khu phức hợp gồm hơn 30 công trình phật giáo lớn nhỏ, bên ngoài được trang trí chủ yếu bằng họa tiết màu vàng rất đẹp và tinh xảo. Cách Grand Place khoảng 700 mét là chùa Wat Pho, nơi được xem là một trong những ngôi chùa linh thiêng nhất ở Bangkok. Tôi vào thăm quan bức tượng phật nằm nổi tiếng và thực sự bị ấn tượng bởi kích thước của bức tượng này. Nó phải dài đến 50 mét và chiều cao khoảng 15 mét. Khung cảnh trong chùa rất đẹp với nhiều cây xanh tỏa bóng nên dù trời rất nắng nhưng bên trong chùa khá mát mẻ. Ngoài ra, có rất nhiều đỉnh tháp nhọn cao vút trên nền trời xanh rất ấn tượng.

Ngày thứ ba ở bang kok tôi đi thăm một khu chợ tên là Get it Supermarket ở gần khách sạn. Trên đường đi, lần đầu tiên tôi thấy các nhà sư đi khất thực. Ngoài ra tôi cũng bắt gặp rất nhiều người dân bản địa dừng lại chắp tay cầu khấn trước cổng chùa, dù là họ chỉ đi ngang qua. Con phố dẫn đến khu chợ được lấp đầy bởi những xe bán hàng từ các loại hoa quả, chè, đến các món rán nướng, các quán ăn bình dân, đồ lưu niệm và cả xổ số. Cũng như ở việt nam, siêu thị bán rất nhiều loại mặt hàng. Tôi tìm mua một ít dầu gió thái lan và một ít xoài khô để mang về làm quà. Buổi chiều, tôi đi ra khách sạn tên là Madarin Hotel, cách khách sạn tôi ở khoảng 5Km. Ngồi trên xe taxi, nhìn đường phố bang kok và hà nội rất giống nhau, từ các quán sá, đến cây cối bên đường. Đầu mùa hè nên tôi còn nhìn thấy lác đác có những cây phượng nở hoa. Đường phố rất đông đúc với phần lớn là xe ô tô. Trong số xe ô tô trên đường thì chắc phải có đến một nửa là xe taxi với đủ loại màu sắc sặc sỡ. Điều này cũng dễ hiểu vì bang kok thu hút rất nhiều khách du lịch quanh năm. Sau khi từ khách sạn Madarin về, tôi đi ăn tối ở quán Kura Apron. Trên đường đi tôi gặp nhiều xe hàng bán thịt nướng mùi thơm phức, giống như trên đường tạ quang bửu vào buổi chiều. Tôi dừng lại và mua một ít thị nướng. Anh chủ quán thấy chúng tôi là người nước ngoài thì hỏi tôi ngay là có phải muốn mang về (take away) không bằng tiếng Anh. Tôi bảo đúng như vậy và chọn 6 miếng thịt nướng và một phần tai lợn nướng. Thịt nướng ở đây có vị khá ngọt và thơm, ăn rất ngon. Vào các quán ăn ở thái lan tôi nhận ra là họ ăn rất nhiều ớt và đường. Trước mỗi quán đều có đặt một bát tô to đựng ớt khô và một bát tô to đựng đường. Tôi đã bắt gặp một anh người bản địa xúc 2 thìa to ớt và một thìa đường cho vào bát phở vừa gọi xong.

Tôi đến trung tâm thương mại Terminal 21 trong ngày cuối cùng ở bang kok, đây là một tòa nhà 5 tầng với mỗi tầng được trang trí theo phong cách của một thành phố trên thế giới. Tầng năm của tòa nhà này có rất nhiều quán ăn với giá rất rẻ, từ 30-50 bạt cho một món. Thức ăn ở đây khá ngon và rất đa dạng. Lần đến Thái này tôi khám phá thêm được một món ăn ưa thích nữa là món xôi xoài. Xôi thì rất thơm vị nước dừa và mềm, còn xoài thì rất ngọt, đúng với khẩu vị của tôi. Nhưng cơm của thái rất cứng, khô. Nên thường các món ăn họ thường rưới thêm nước xốt vào. Điều này làm tôi khá thất vọng vì gạo thái bán ở bên việt nam ăn rất ngon. Khoảng hai giờ chiều tôi lên xe taxi về khách sạn. Đi được khoảng 3-4Km thì xe taxi bắt đầu dừng lại và không nhúc nhích được vì tắc đường, cuối cùng sau hơn 2 tiếng ngồi trên taxi tôi mới về được đến khách sạn. Chính vì trải nghiệm này nên tôi quyết định đi ra sân bay ngày hôm sau bằng tàu thay vì bằng taxi như dự định ban đầu.

Dù vẫn còn nhiều địa điểm chưa đi được và nhiều món ăn chưa có dịp thưởng thức, thái lan là đất nước tôi thích nhất trong các nơi đã đi. Con người ở đây thân thiện và nhẹ nhàng, thức ăn ngon, và giá cả rất vừa phải. Hy vọng sẽ có một ngày được trở lại Thái lan để khám phá thêm về đất nước này.

Friday, June 14, 2019

Paris du ký (Phần 1)

Cuối tháng 4 đầu tháng năm, Tôi có dịp đến thăm Paris để tham dự hôi thảo IEEE INFOCOM 2019. Mất gần 1 ngày với 2 chặng bay và 2 chặng xe bus, tôi đến khách sạn vào tầm 10h sáng. Đường đi từ sân bay Paris de Gaulle về khách sạn có nhiều đoạn rất tắc, chắc là do đầu tuần. Đường này có đi qua sân vận động State de France nơi diễn ra trận chung kết world cup 98 nổi tiếng.

Khách sạn tôi ở nằm trên đường Louise Michale ở khu Levallois-Perret, cách trung tâm Paris khoảng 6km. Louise Michale là tên một nữ giáo viên có vai trò quan trọng trong chính quyền công xã Paris. Vì còn thời gian cho đến khi check-in nên tôi đi thăm thú khu xung quanh khách sạn. Ấn tượng đầu tiên của tôi là có rất nhiều quán ăn châu Á, đặc biệt là Nhật bản. Chỉ trên 2, 3 tuyến đường quanh khách sạn tôi phải thấy có gần 10 quán ăn châu Á. Và vì là người Việt Nam nên cứ nhìn thấy quán Phở là tôi lại thấy tò mò. Trên đường phố cũng có nhiều cửa hàng tạp hóa nhỏ bán hoa quả, rau củ, và tất nhiên là có cửa hàng bánh. Đường phố ở Paris khá rộng rãi, hai bên là những dãy nhà cao tầng với kiến trúc khá giống nhau. Một điểm dễ nhận ra là các tòa nhà đều có 5 tầng (trừ tầng áp mái). Ngoài ô tô và xe máy, tôi thấy rất nhiều thanh niên sử dụng scooters (một loại xe điện mà chỉ có thể đứng) để đi lại. Một điều tôi nhận ra ngay là ở Paris không cần phải chờ đến lúc đèn xanh mới được đi qua đường. Nhìn không có xe đến là mọi người cứ đi qua. Cái này tôi thấy không chỉ ở các đường bé mà ngay cả các ở các đường lớn với nhiều ô tô chạy qua cũng như vậy.

Dạo một vòng các tuyến phố Louise Michale, phố Jean jaures, rồi phố Victor Hugo, tôi vào quán tên là  Phô 92 để ăn trưa. Đến lúc thấy nhân viên phục vụ ra mới biết quán này là do người Trung Quốc mở, giờ mới hiểu tại sao chữ Phở lại biến thành Phô. Tôi gọi một bát phở bò giá 10 euros (khoảng 250 nghìn VNĐ). Nguyên liệu nhìn giống phở ở việt nam nhưng vị thì không. Mấy hôm sau tôi vào một quán ăn thái lan thì cũng hệt vậy, toàn bộ nhân viên là người Trung. Tôi không vào quán Nhật nào nhưng chắc cũng là do người Trung mở ra. Trong suốt thời gian ở Paris, tôi gần như chỉ ăn ở quán tên là Bambou. Quán này nấu món châu Á và tất nhiên do người Trung mở. Tôi chọn quán này vì nó gần khách sạn, thức ăn hợp khẩu vị và giá cũng vừa phải (khoảng 7-8 euros một bữa).

Sáng sớm ngày thứ 2 ở Paris, tôi dậy sớm vì do lệch giờ. Bên ngoài trời đang mưa nhưng tôi vẫn quyết định ra ngoài để xem buổi sáng Paris như thế nào. Phần lớn các cửa hàng, quán sá vẫn đang đóng cửa. Cũng không có nhiều người đi ngoài đường, Đi một lúc thì tôi vào một cửa hàng bánh đang mở cửa. Nghe nói Pháp nổi tiếng về các loại bánh nên tôi cũng tìm mua để ăn thử. Vào cửa hàng thì thấy có một chị cũng đang mua bánh. Tôi nói Bonjour (chào buổi sáng) rồi ra chọn bánh. Tôi mua một cái bánh sừng bò (Croissants), một cái Pain au chocolate (bánh mỳ sô cô la), một cái French Boule (bánh mỳ ngọt), và một cái Schnecken. Những loại bánh này mềm và nhẹ, nhưng ăn khá ngấy vì có khá nhiều bơ. Ăn kèm với một cốc cafe có vẻ là hợp nhất. Đi trên đường phố Paris thì tôi thấy rất nhiều người cầm trên tay một cái bánh mỳ dài (baguette). Loại bánh mỳ này có vỏ cứng và phần ruột đặc hơn bánh mỳ việt nam mình rất nhiều, nên nó hay được cắt thành từng lát để ăn với bate hay thịt hun khói.

Đến chiều, tôi đi ra địa điểm tổ chức hội nghị để lấy giấy tờ. Ở Paris thì có thể đi lại bằng xe bus hoặc tàu. Tôi chọn đi tàu vì quen hơn. So với ga tàu ở Tokyo thì ga tàu ở Paris bé hơn, thường chỉ có từ 2-3 làn. Từ chỗ tôi ở đến hội nghị đi mất khoảng 40 phút, và phải đổi tàu hai lần. Vé cho một lần đi là 1.9 euro. Tàu ở Paris thì khi muốn xuống mình sẽ phải tự mở cửa, nên phải để ý nếu không sẽ không xuống được. Lên chuyến tàu thứ 3 thì tôi thấy một người đánh đàn ghi ta và hát. Tiếng đàn hát nghe rất hay, làm cho việc ngồi trên tàu đỡ chán. Sau này tôi còn gặp nhiều người hát rong ở trên tàu và cả trên các đường phố ở Paris.

Đến khách sạn tổ tức hội nghị tôi thấy các nhân viên khách sạn đang che các cửa kính ở cổng vào bằng các tấm gỗ. Lúc đầu tôi thấy hơi lạ nhưng hai hôm sau thì tôi biết tại sao lại phải làm vậy. Ngày 1 tháng 5, tôi đi sớm để có thể dạo qua vườn Luxembourg và nhà thờ đức bà Paris. Đường phố Paris sáng sớm rất yên tĩnh. Nhưng đi được một lúc thì tôi bắt đầu thấy tiếng còi xe cảnh sát vang lên ngày một dầy hơn. Đến cổng vườn Luxemboug thì tôi thấy không có ai ở bên trong và cửa thì đóng. Ở cửa có một đội đội mũ mặc áo như đội y tế, tôi hỏi ra thì mới biết là hôm nay vườn Luxembourg đóng cửa. Ngoài ra tôi cũng để ý thấy có một xe cảnh sát đang ở cửa. Sau đó tôi đi ra nhà thờ đức bà tham quan vì nó chỉ cách vườn Luxemboug chừng 30 phút đi bộ. Trên đường đi tôi thấy rất nhiều nhà thờ có kiến trúc rất độc đáo với nhiều vòi dẫn nước hình các con vật và các mái vòm cong. Bạn tôi cho biết đây là phong cách kiến trúc Gothic, thịnh hành ở Pháp từ thế kỷ 12 đến thế kỷ 16. Nhà thờ đức bà Paris nằm trên một hòn đảo nhỏ giữa sông Xen. Thật không may vì công trình này đang bị đóng cửa vì vụ hỏa hoạn trong lúc đang tu sửa. Đứng nhìn từ xa nhìn nhưng tôi vẫn có thể cảm nhận được sức hút cũng như sự đồ sộ của công trình này. Hy vọng sẽ có một ngày tôi có dịp vào tham quan bên trong.

Trên đường về khách sạn tổ chức hội nghị, tôi lại nghe thấy tiếng còi xe cảnh sát mỗi lúc một thường xuyên hơn. Cuối cùng tôi cũng biết là do hôm nay có biểu tình lớn của người lao động ở Paris. Đợt biểu tình này đã xảy ra hơn 1 năm và ngày mồng 1 tháng 5 hàng năm luôn có biểu tình lớn nhất. Rất nhiều xô xát với cảnh sát đã nổ ra với hơn 200 người bị bắt. Khách sạn chỗ hội nghị tổ chức chỉ cách chỗ biểu tình chính khoảng 2Km,, nên các nhân viên khách sạn phải bọc các cửa kính lại để phòng trường hợp bị phá hoại. Hôm đó, các tuyến phố bị phong tỏa và tàu điện ngầm cũng đóng cửa đến 7h tối. Tôi về khách sạn lúc tầm 9h tối, mua một ít đồ ăn và nghỉ ngơi, kết thúc một trải nghiệm đáng nhớ ở Paris.

   

Friday, April 5, 2019

Giới thiệu về Behavioral Targeting (Phần 1)

Behavioral Targeting là gì?

Chắc hẳn đã có nhiều lần bạn cảm thấy khó chịu và phải tắt các quảng cáo không phù hợp khi đang lướt web. Behavioral targeting là một phương pháp marketing sử dụng thông tin của người dùng để tăng tính hiệu quả cho các chiến dịch quảng cáo cũng như tạo sự thoải mái cho người dùng. Một ví dụ của Behavioral targeting là việc bạn có thể nhìn thấy các quảng cáo về máy tính của Amazon xuất hiện khi bạn xem Facebook, sau khi bạn xem hoặc mua các sản phẩm liên quan đến máy tính trên Amazon. Kỹ thuật này hoạt động dựa trên việc tập hợp dữ liệu và phân tích hành vi (behaviors) của người dùng. Ví dụ như bạn hay tìm kiếm các thông tin gì, các trang web ưa thích của bạn là gì, trong quá khứ bạn đã mua những gì qua các trang web bán hàng online.

Các công ty tập hợp dữ liệu của khách hàng như thế nào?


Hình trên là thông báo mà bạn sẽ gặp khi vào một trang web mới. Khi bạn chọn "I ACCEPT", các công ty sẽ có thể theo dõi cách bạn tìm kiếm và sử dụng thông tin trên website của họ thông qua một công cụ gọi là Cookie. Cách thức hoạt động của Cookie rất đơn giản, đầu tiên các website sẽ tạo ra một mã số (ID) cho mỗi một người dùng. Trình duyệt web trên thiết bị người dùng sẽ lưu lại mã số này. Mỗi lần người dùng truy nhập lại vào website đó, trình duyệt web sẽ chèn thêm ID vào thông tin nó gửi đến máy chủ web server. Bằng cách này, các công ty có thể thu thập được thông tin về thời gian, nội dung một người dùng hay xem, và thậm chí là các quảng cáo người đó đã click. Nếu bạn đã tạo tài khoản (User Account) trên một website, thì các công ty có thể kết hợp các thông tin cá nhân như tuổi, giới tính, nghề nghiệp của bạn với thông tin thu được từ Cookie.

Dữ liệu khách hàng mà các công ty có được từ khách hàng của chính mình được gọi là "first-party data". Để mở rộng đối tượng khách hàng, các công ty có thể mua first-party data từ các công ty khác. Dữ liệu loại này được gọi là second-party data. Loại dữ liệu thứ ba được gọi là third-party data,  đây là dữ liệu người dùng được tập hợp từ nhiều nguồn bởi các công ty gọi là Content Aggregrators. Điểm mạnh của loại dữ liệu này là nó được cập nhật thường xuyên với số lượng lớn. Trong lĩnh vực quảng cáo online, first-party data là loại dữ liệu mang lại hiệu quả nhất. Sự thành công của các công ty bán hàng trực tuyến như Amazon, Ebay, Alibaba có vai trò quan trọng của việc phân tích và sử dụng first-party data.





Sunday, March 31, 2019

Tech news (week #13)

SRT (Secure realiable transport) là một giao thức mã nguồn mở phát triển bởi công ty Haivision [1]. Giao thức này cho phép các đài truyền hình truyền video chất lượng cao với trễ thấp qua mạng Internet. Được giới thiệu từ năm 2013, SRT đã nhanh chóng trở thành một chuẩn streaming phổ biến cho các đài truyền hình. Vào năm 2017, công ty Haivision quyết định công khai mã nguồn của SRT và hợp tác với Wowza [3] lập nên SRT Alliance [4] nhằm thúc đẩy sự phát triển của SRT. SRT hiện đã được hỗ trợ bởi VideoLAN's VLC, GSstreamer, và FFmpeg. Các công ty lớn như Microsoft và Eurovision hiện đang sử dụng SRT để cung cấp các dịch vụ live streaming chuyên nghiệp. Điểm nổi bật của SRT so với các giao thức streaming khác là khả năng đảm bảo trễ thấp và khả năng chống lỗi cao.

Gần đây khi xem Youtube có thể bạn sẽ để ý nhiều khi hình ảnh video bị lỗi dù chỉ là xem ở chế độ on-demand. Nguyên nhân của những lỗi đó là do YouTube đã thay đổi giao thức truyền video từ HTTP/TCP thành QUIC [5]. QUIC (Quick UDP Internet Connections) là một protocol phát triển bởi Google từ năm 2012 và còn được gọi là HTTP/3. Nó chạy trên UDP nên sẽ xảy ra việc mất gói tin trên đường truyền. Khi một phần thông tin của một ảnh bị mất trên đường truyền, lỗi sẽ xuất hiện khi giải nén ảnh đó.

Video trên thiết bị di động đang trở nên phổ biến hơn bao giờ hết, theo báo cáo mới nhất từ Verizon Media Research [6], thời gian người dùng dành để xem video trên điện thoại và máy tính bảng tăng 88% mỗi năm. Sự gia tăng chủ yếu đến từ các công nghệ mới như AR và VR. Các nhà quảng cáo vì vậy cũng đang đầu tư rất mạnh vào mảng quảng cáo trên di động. Theo một báo cáo từ comScore, người dùng trẻ chỉ chấp nhận quảng cáo với độ dài từ 5-6 giây [7]. Điều này đặt ra thử thách rất lớn cho các nhà quảng cáo. Với quảng cáo 6s, bạn phải tạo ra sự ngạc nhiên và hứng thú cho người xem trong vòng 2s đầu tiên [8].

[1] https://www.haivision.com/
[2] https://www.haivision.com/products/srt-secure-reliable-transport
[3] https://www.wowza.com/
[4] https://www.srtalliance.org/
[5] https://en.wikipedia.org/wiki/QUIC
[6] https://www.oath.com/insights/study-all-eyes-on-digital-videos/
[7] https://www.cnbc.com/2017/07/21/comscore-ceo-millennials-need-5-to-6-second-ads-to-hold-attention.html
[8] http://www.onlinevideo.net/2019/02/mobile-video-soars-six-second-ads/

Sunday, March 24, 2019

Tech news (week #12)

Theo báo cáo mới nhất từ Penthera [1], 88% người dùng mobile để stream/xem video (mobile streamers/viewers) ở Mỹ đã từng gặp những vấn đề gây ra sự khó chịu khi xem video. Con số này tăng 7% so với số liệu năm 2018. Những nguyên nhân chính gây ra sự khó chịu là bị dừng hình (buffering), quảng cáo, và mất quá lâu để video bắt đầu chạy (too long start-up delay). Người dùng có yêu cầu rất cao về chất lượng streaming, thậm chí là trên thiết bị di động. 56% số người được hỏi cho biết họ sẽ từ bỏ việc xem video nếu gặp phải một trong những vấn đề nêu trên; 18% số người đã dừng việc sử dụng dịch; 7% hủy hợp đồng, và 7% sẽ viết những review tiêu cực trên app store. Để tránh các vấn đề có thể gặp phải, 69% số người được hỏi cho biết họ mong muốn có lựa chọn tải trước những chương trình yêu thích về thiết bị của họ. Đây là cách truyền thống mà Apple hay Netflix áp dụng trước đây khi băng thông của mạng Internet chưa tốt. Kết quả của báo cáo này cho thấy việc đảm bảo một chất lượng streaming tốt (không dừng hình, bắt đầu nhanh) cho người dùng thiết bị di động vẫn là một vấn đề nan giải và cần các thuật toán mới để giải quyết.

Chuẩn nén video AV1 (AV1 codec) của Alliance for Open Media đã được tích hợp vào bản ffmpeg-4.0. Bạn có thể thử nghiệm chuẩn nén video mới nhất này theo hướng dẫn từ ffmpeg [2]. Theo những thử nghiêm mới nhất, dù đạt được hiệu suất nén tương đương hoặc tốt hơn HEVC, AV1 có tốc độ nén chậm hơn khá nhiều so với các codec phổ biến hiện nay như x264, x265, libvpx. Cụ thể, AV1 chậm hơn khoảng 3 lần so với x265 và libvpx, và khoảng 40 lần so với x264 [3]. Do vậy, rất nhiều cải thiện sẽ cần phải được thực hiện nếu muốn đưa AV1 vào sự dụng trong thực tế.

*Alliance for Open Media [4]: Là một tổ chức được thành lập năm 2015 bởi các công ty Inernet lớn bao gồm Amazon, Cisco, Google, Intel, Microsoft, Mozilla, Netflix. Mục tiêu của tổ chức này là tạo ra một nền tảng truyền video miễn phí (Royalty-free Video Streaming Ecosystem) giúp cho sự phát triển của các ứng dụng truyền video trên Internet. Chuẩn nén video AV1 là sản phẩm đầu tiên của tổ chức này. Hiện tại, bạn sẽ phải trả tiền nếu muốn sự dụng các chuẩn nén thông dụng như AVC/H.264, HEVC/H.265 trong thiết bị, dịch vụ của mình. AV1 được kỳ vọng sẽ là một giải pháp thay thế miễn phí cho các nhà phát triển và cung cấp dịch vụ.


[1] US Mobile Streaming Behavior Survey, https://info.penthera.com/2019usreport
[2] https://trac.ffmpeg.org/wiki/Encode/AV1
[3] https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Good-News-AV1-Encoding-Times-Drop-to-Near-Reasonable-Levels-130284.aspx
[4] https://aomedia.org/


Saturday, March 2, 2019

Book review: コンビニ人間

Quyển sách kể về một phụ nữ độc thân 36 tuổi, làm việc ở một cửa hàng tiện lợi. Lúc còn nhỏ, cô suy nghĩ và hành động không giống những đứa trẻ bình thường, gây ra rất nhiều rắc rối. Khi thấy một con chim bị chết, cô bảo với mẹ rằng hãy lấy về nấu lên ăn cho ngon. Khi thấy hai bạn đánh nhau, thay vì gọi thầy giáo đến thì cô lấy ngay cái chổi đánh vào đầu hai người đó. Sau những lần như vậy, cô luôn bị mẹ mình nhắc nhở, và sau nhiều lần thấy mẹ phải đến trường xin lỗi các thầy cô giáo, cô quyết định không gây ra bất cứ điều gì rắc rối nữa, chỉ làm theo những gì người khác bảo. Năm thứ nhất đại học, cô đăng ký làm thêm ở một cửa hàng tiện lợi. Sau khi tốt nghiệp, thay vì đi tìm việc, cô tiếp tục làm việc ở cửa hàng, cho đến nay đã được 18 năm. Đây là một điều không bình thường đối với một người phụ nữ trong xã hội, những người được mặc định là hoặc phải kết hôn, hoặc phải tìm được một công việc ổn định. Nhưng cô lại không thấy điều gì bất thường cả. Cô cho rằng mình là một người "bình thường", và tận hưởng cảm giác được hòa mình vào dòng chảy của cuộc sống.

Sau 18 năm làm việc, cô đã trở thành một nhân viên kỳ cựu và được mọi người quý mến. Cô yêu thích công việc của mình và luôn cố gắng hết mình để làm tốt nhất. Hàng ngày cô luôn là người đến sớm nhất, chăm lo cho mọi ngóc ngách của cửa hàng để khách hàng luôn có được ấn tượng tốt nhất. Vào những ngày nghỉ, cô thường đến thăm bạn bè, người thân của mình. Cứ mỗi lần như thế, cô luôn bị hỏi về việc đã có người yêu chưa? tại sao lại làm thêm suốt 18 năm mà không tìm một việc làm chính thức? Mẹ của cô lúc nào cũng hỏi cô dạo này có gì mới không?. Những lúc như thế, cô chỉ trả lời qua loa cho xong chuyện theo những câu trả lời mà em gái cô đã chuẩn bị sẵn. Tuy nhiên, cô vẫn luôn suy nghĩ về việc mình có thật là một người "bình thường" hay không? Mình phải làm gì để trở thành một người "bình thường"? 

Đến một ngày, có một anh chàng nhân viên tập sự đến cửa hàng của cô. Anh chàng này cũng không có việc làm và phải đến xin việc ở đây. Tuy nhiên, anh ta làm việc rất lười biếng và suốt ngày than phiền về xã hội không công bằng với mình. Anh ta luôn cho rằng xã hội ngày nay không khác gì thời phong kiến, nơi những người không "làm theo" những người khác sẽ bị đào thải. Tệ hơn nữa, anh ta còn cố tình bám theo một khách hàng nữ. Sau khi việc bị phát hiện, anh ta bị đuổi dù chưa được vào làm chính thức. Một lần khác cô phát hiện anh chàng này đến cửa hàng, cô lôi anh ta đến một quán nước ở gần để anh ta thôi làm phiền những khách hàng khác. Như mọi khi, anh chàng vẫn thao thao bất tuyệt về việc xã hội này bất công như thế nào với anh ta? anh ta còn lôi cô ra mà chế giễu, gọi cô là đồ bỏ đi của xã hội. Cô không phản ứng, thay vào đó ngẫm nghĩ về những gì anh chàng này nói. Cô nảy ra ý định thuê anh chàng này làm bạn trai. Anh ta dù tỏ ra tự cao tự đại nhưng cuối cùng cũng nhận lời vì hiện tại không có chỗ ở, không có tiền ăn, và còn phải trả nợ.

Cô nhận thấy rõ sự thay đổi trong cách mọi người xung quanh cư xử với mình sau khi cô thông báo cho mọi người về anh chàng. Em gái cô phát khóc vì sung sướng biết rằng chị gái mình cuối cùng cũng thành người "bình thường". Các đồng nghiệp ở chỗ làm trước đây chỉ nói chuyện công việc, giờ chỉ quan tâm đến chuyện tình cảm giữa cô và anh chàng kia. Lý lịch của anh chàng cũng được đưa ra để bàn tán ngay trong giờ làm việc. Cô còn nhận ra rằng các đồng nghiệp của cô thật ra thường đi ăn uống cùng nhau nhưng không mời cô. Chỉ đến khi nghe tin cô có bạn trai, họ thay nhau rủ cô, có lẽ vì cô đã trở nên "giống họ".

Để trở nên "bình thường" hơn nữa, cô quyết định nghỉ việc làm thêm để tìm một việc làm ổn định như mọi người khác với sự giúp đỡ của anh chàng bạn trai. Tuy nhiên, mọi việc không suôn sẻ như cô nghĩ. Giờ giấc, thói quen sinh hoạt đã gắn liền với cô trong suốt 18 năm đã biến mất chỉ sau 2 tuần nghỉ việc ở của hàng. Trước đây, cô luôn cố gắng ăn ngủ điều độ để duy trì được thể trạng tốt nhất cho mỗi ngày làm việc. Cô giờ đây ngủ muộn, dậy muộn, ăn mỳ tôm hộp.

Đến một ngày, trên đường đến chỗ phỏng vấn xin việc, cô ghé qua một cửa hàng bên đường. Đó là lần đầu tiên cô vào lại một cửa hàng tiện lợi kể từ khi nghỉ việc. Bước vào cửa hàng, cô đột nhiên cảm nhận được những âm thanh quen thuộc, âm thanh của cửa hàng. Bước đến quầy bán bánh kẹo, cô nhận ra những sản phẩm bán chạy lại được xếp ở tầng dưới cùng, chỗ mà khách hàng rất khó để ý. Như một phản ứng tự nhiên, cô sắp xếp lại quầy hàng, đặt những đồ bán chạy lên tầng cao nhất, sắp thành ba hàng ngay ngắn. Cô bước đến quầy bán nước, những ngày nóng như thế này thì phải đặt thêm nước lọc đóng chai. Những ý nghĩ cứ ùa đến trong cô, cô như nghe được những âm thanh của cửa hàng, những thứ cửa hàng thực sự cần. Cô có thể cảm nhận được tất cả. Cô chợt nhận ra rằng đây mới là nơi cô thực sự thuộc về. Cô chia tay anh chàng, và bắt đầu tìm kiếm thông báo tuyển việc của một cửa hàng tiện lợi. 

Sunday, February 24, 2019

Overview of JETCAS Issue on Immersive Video Coding and Transmission (Part 1)

JETCAS issue on immersive video coding and transmission presents the latest developments in immersive video research. This blog summarizes the papers related to coding and transmission of 360-degree video, which is one of the most popular types of immersive media.

360-degree Video Coding

To provide an excellent immersive experience, 360-degree videos require extremely high resolution with high frame rate (4K/8K + 60/90 fps). As a result, 360 video require much higher bandwidth compared with conventional 2D video. Therefore, efficient compression technology is highly desirable for storage and transmission of 360 video.

The paper [1] proposes a hybrid Equirectangular-Cubemap projection that can achieve more uniform sampling and reduce the boundary artifacts across different faces. In addition, a set of coding tools that can make use of the spherical continuity in 360 video are proposed. The proposed algorithm can effectively reduce the BR-rate and the seam artifacts caused by discontinuous edge and frame boundary.

In [2], the projection format is customized based on the input video content. Especially, the hybrid angular cubemap (HAC) projection is utilized to adapt the the sampling within each face. Also, an adaptive frame packing technique is used to select the face arrangement in a frame. To alleviate the "face seam" artifacts in the rendered viewports, the relationship of samples and blocks in the spherical geometry is considered to improve intra/inter prediction and in-loop filters.

To address the deformation of video content caused by mapping from sphere to 2D plan, the paper [3] proposes a new motion model based on spherical coordinates transform. The proposed model is shown to be effective in improving the motion compensation/estimation in panoramic video coding.

360-degree Video Transmission

Though advanced coding technologies can significantly reduce the bitrate of 360 video, delivery of 360 video is still a challenging task due to limitations in network resources, as well as constraints imposed by en-user devices. Therefore, cost-effective delivery technology is necessary for the wide adoption of VR/AR applications.

In [4], we propose a server-based adaptation framework for 360 video streaming over networks. The proposed method utilizes tiling-based viewport adaptive streaming to reduce the required network bandwidth for 360 video. Also, the proposed tile selection algorithm can effectively deal with the user head movements within each video segment.

In tiling-based viewport adaptive streaming, it is important to tile the video in an effective manner. Conventionally, the video is divided into equal sized tiles. The paper [5] addresses this issue by considering the Visual Attention map. Especially, the video is divided in to non-overlapping variable sizes taking into account the Visual Attention map.

Effective viewport adaptation methods require accurate estimations of viewport positions. However, the large buffer size in HTTP Adaptive Streaming may severely affect viewport position estimation accuracy. Taking the idea of scalable video coding, [6] can reduce the client buffer size down to one segment duration by using a two-tier system. To achieve this feature, the whole video is encoded into a base tier, which is always delivered to the client, and multiple enhancement layers each corresponds to a viewport position.

In [7], the authors analyze the impact of the end-to-end delay to tile-based viewport adaptive streaming. It is found that the gain compared to viewport-independent approach drops to 8% for a delay of 1 second. To address this issue, the authors propose to combine viewport prediction with a velocity-based QP distribution.

To facilitate delivery of 360 video over wireless networks, the paper [8] proposes a pseudo-analog transmission framework called OmniCast. The proposed framework features a spherical domain power-distortion optimization framework and two adaptive block partitions algorithms. Experiment results shows that the proposed framework outperforms JPEG2000-based solution and the conventional Softcast.

The last paper [9] presents a real time 3D 360-degree telepresence system. To deal with the mismatch between the estimated and actual viewports caused by system delay, the proposed system uses cameras with a larger field of view than the visual field of the user. The level of delay compensation is improved with Gate Recurrent Units (GRU)-based head-motion prediction method.

References
[1] J. Lin et al., "Efficient Projection and Coding Tools for 360° Video," doi: 10.1109/JETCAS.2019.2899660
[2] P. Hanhart, X. Xiu, Y. He and Y. Ye, "360-degree Video Coding based on Projection Format Adaptation and Spherical Neighboring Relationship," doi: 10.1109/JETCAS.2018.2888960
[3] Y. Wang, D. Liu, S. Ma, F. Wu and W. Gao, "Spherical Coordinates Transform-Based Motion Model for Panoramic Video Coding," doi: 10.1109/JETCAS.2019.2896265
[4] D. V. Nguyen, H. T. T. Tran, A. T. Pham and T. C. Thang, "An Optimal Tile-based Approach for Viewport-adaptive 360-degree Video Streaming," doi: 10.1109/JETCAS.2019.2899488
[5] C. Ozcinar, J. Cabrera and A. Smolic, "Visual Attention-Aware Omnidirectional Video Streaming Using Optimal Tiles for Virtual Reality," doi: 10.1109/JETCAS.2019.2895096
[6] L. Sun et al., "A Two-Tier System for On-Demand Streaming of 360 Degree Video over Dynamic Networks," doi: 10.1109/JETCAS.2019.2898877
[7] Y. Sanchez, G. S. Bhullar, R. Skupin, C. Hellge and T. Schierl, "Delay Impact on MPEG OMAF’s tile-based viewport-dependent 360° video streaming," doi: 10.1109/JETCAS.2019.2899516
[8] J. Zhao, R. Xiong and J. Xu, "OmniCast: Wireless Pseudo-Analog Transmission for Omnidirectional Video," doi: 10.1109/JETCAS.2019.2898750
[9] T. Aykut, J. Xu and E. Steinbach, "Realtime 3D 360-degree Telepresence with Deep-learning-based Head-motion Prediction," doi: 10.1109/JETCAS.2019.2897220


 




Saturday, February 23, 2019

Tổng quan về hệ thống live video streaming (Phần 2)


Trễ trong hệ thống live streaming

Như đã phân tích trong phần 1, video sau khi thu phải trải qua các công đoạn nén (encoding), truyền (transmission), giải nén (decoding) trước khi được hiển thị lên màn hình của người dùng.  Thời gian cần để xử lý mỗi công đoạn trên gây ra trễ (delay) giữa thời gian thực tế của sự kiện và thời gian người dùng xem sự kiện. Các thành phần trễ chính trong hệ thống live streaming được chỉ ra trong hình trên. Ở đây, trễ được tính từ lúc một ảnh được đưa vào Encoder cho đến khi ảnh đó ra khỏi Decoder.

  1. Encoding delay: Đây là thời gian Encoder cần để nén một ảnh của video. Các Encoder sẽ có các lựa chọn về thời gian nén cho các ứng dụng khác nhau. Với cùng một mức chất lượng đầu ra, thời gian nén càng nhanh sẽ làm cho hiệu suất nén giảm và ngược lại. Thời gian thực tế để nén một ảnh phụ thuộc vào nhiều yếu tố, ví dụ như encoder được cài đặt trên phần mềm (software-based encoder) hay phần cứng (harward-based encoder), kích thước của ảnh, chất lượng đầu ra của ảnh. Các encoders nhanh nhất hiện nay có thể nén một ảnh dưới 1 mili giây.  
  2. Packetization delay: Như đã phân tích trong phần 1, việc truyền dữ liệu từ bên gửi đến bên nhận được thực hiện thông qua các giao thức streaming (streaming protocols). Bạn có thể xem các giao thức này như các công ty vận chuyển hàng hóa. Để có thể chuyển hàng đến đúng người nhận thì sau khi nhận hàng, các công ty này sẽ phải đóng gói, thêm địa chỉ người nhận/gửi rồi mới gửi đi. Công việc của các streaming ptococols cũng tương tự như vậy. Và việc đóng gói (Packetization) gây ra trễ trong hệ thống. Thời gian cho việc đóng gói này có thể chỉ vài mili giây (RTP, RTMP) nhưng cũng có thể lên đến vài giây (MPEG-DASH, HLS). 
  3. Transmission delay: Đây là thời gian để chuyển dữ liệu từ bên gửi đến bên nhận. Cũng tương tự như việc vận chuyển hàng hóa. Thời gian chuyền dữ liệu phụ thuộc vào 1) khoảng cách giữa bên gửi và bên nhận, 2) tốc độ của đường truyền, 3) đặc tính của giao thức truyền.
  4. Client buffering delay: Khi bạn bắt đầu nhấn nút play, các ảnh trong video được giải nén và hiện thị lên màn hình với tốc độ không đổi bằng frame rate của video. Do vậy, nếu một ảnh không đến được phía nhận trước thời gian nó phải được hiện thị, quá trình hiển thị video sẽ bị chậm, gây ra hiện tượng giật lag khi xem. Do mạng Internet không đảm bảo một băng thông cố định, thời gian truyền mỗi ảnh sẽ rất biến động. Do vậy, khả năng cao là người xem sẽ phải chứng kiến rất nhiều hiện tượng giật lag nếu việc hiển thị video được thực hiện ngay sau khi ảnh đầu tiên của video đến. Để xử lý vấn đề này, bên nhận sẽ không bắt đầu quá trình hiện thị video ngay khi ảnh đầu tiên đến, mà thay vào đó đợi cho đến khi một số lượng ảnh nhất định đã được nhận thì mới bắt đầu. Thời gian này gọi là "client buffering delay". Thời gian này có thể từ vài trăm mili giây đến vài giây, phụ thuộc vào từng hệ thống.
Các hệ thống live streaming có nhiều yêu cầu khác nhau về thời gian trễ.
  1. 1s-5s: Các ứng dụng như trực tiếp các sự kiện thể thao, tin tức yêu cầu trễ từ 1-5 giây. Điều này để đảm bảo rằng tín hiệu nhận được không bị chậm hơn tín hiệu trên tivi. Trung bình trễ trong các hệ thống truyền hình cáp là 5-6 giây. Với các dịch vụ OTT, đây sẽ là mục tiêu chính để có thể tiến tới thay thế hoàn toàn tivi.  
  2. 200ms-1s: Mức trễ này là yêu cầu đối với các ứng dụng như cá cược/đấu giá trực tuyến, camera giám sát.
  3. < 200ms: Các hệ thống tương tác như video call, cloud gaming, hay telepresence yêu cầu mức trễ này để có thể đảm bảo được chất lượng dịch vụ. Các hệ thống video call tốt nhất hiện nay (Google Hangout, Skype) có trễ gần với mức này. Các ứng dụng như cloud gaming hay telepresence yêu cầu trễ phải dưới 100ms. Các công nghệ, kỹ thuật mới là rất cần thiết để có thể đảm bảo được mức trễ này. 





Sunday, February 17, 2019

Tổng quan về hệ thống live video streaming (Phần 1)


Live video streaming là gì?

Live video streaming là hệ thống giúp bạn xem trực tiếp bóng đá, tivi, concert qua mạng Internet, gọi video call cho bạn bè qua Skype, Facebook Messenger, hay điều khiển robot từ xa (telepresence).

Hai vấn đề chính với hệ thống live streaming?

1. Tín hiệu nhận từ hệ thống live streaming bị chậm hơn so với tín hiệu trên tivi: Bạn hẳn sẽ rất khó chịu khi nhà bên cạnh đã hò hét ầm ĩ khi có bàn thắng trong khi tỷ số trên màn hình máy tính của bạn vẫn là 0-0.

2. Bị dừng hình trong lúc đang xem (buffering): Vấn đề này gây ra do hệ thống không thích ứng được sự biến động đường truyền Internet , đặc biệt là trong các trường hợp dùng Wifi hay mạng di động.

Hệ thống live streaming hoạt động như thế nào?

Trước hết, các bạn cần phải hiểu một số khái niệm, thành phần cơ bản cho việc truyền video qua mạng Internet.

1. Video Capturing (Thu video): Việc thu video được thực hiện bằng việc chụp các ảnh liên tiếp nhau. Phổ biến nhất hiện nay là 30 hoặc 60 ảnh trên 1 giây (30/60fps). Bạn có thể thu video từ camera của smartphone, webcam của laptop, hay từ các máy quay chuyên nghiệp.

2. Video encoding/decoding (Nén/giải nén video): Video gốc thường chứa rất nhiều thông tin dư thừa, ví dụ như hai ảnh  liên tiếp nhau thường có rất nhiều phần giống nhau, thậm chí trong cùng một ảnh cũng có những phần giống nhau. Ngoài ra, có rất nhiều thông tin trong video mà mắt con người không phân biệt được. Những đặc tính này được sử dụng để làm giảm kích thước của video gốc thông qua loại bỏ các thông tin dư thừa. Quá trình này được gọi là nén video. Các công cụ tốt nhất hiện nay có thể làm giảm kích thước của video gốc vài trăm lần. Video với độ phân giải HD sau khi nén  có bitrate từ 6Mbps-10Mbps (Bitrate: số lượng dữ liệu tính theo bit có trong 1 giây video). Giải nén video là quá trình khôi phục lại video gốc từ video đã được nén. Việc này sẽ được thực hiện ở phía nhận tín hiệu, cụ thể các trình duyệt Web hoặc các Mobile apps sẽ chịu trách nhiệm việc này.

3. Protocol (Giao thức): Protocol là ngôn ngữ mà các máy tính dùng để giao tiếp với nhau. Cụ thể, thì nó là một tập hợp các quy tắc, định dạng, và hành động để truyền dữ liệu từ máy tính này đến  máy tính khác. Có rất nhiều giao thức được sử dụng cho nhiều mục đích khác nhau. Bài này sẽ chỉ tập trung vào các giao thức để truyền video.

Hình 1: Các thành phần của hệ thống live streaming.

Hệ thống live streaming hoạt động như sau:
1. Camera thu video sau đó chuyển cho Encoder
2. Encoder nén video rồi chuyển cho Sender
3. Sender sẽ gửi video đã được nén đến bên nhận Receiver
4. Receiver nhận video rồi chuyển cho Decoder
5. Decoder sẽ giải nén video và sau đó video sẽ được hiển thị lên màn hình người dùng.

Chú ý rằng camera sẽ gửi dữ liệu đến Encoder sau khi thu được một số lượng ảnh nhất định. Các Encoder phổ biến hiện nay bao gồm x264, x265, và OBS. Để phù hợp với live streaming, các encoders hiện nay thường được cài đặt trên phần cứng (hardware-based encoding). Tương tự như vậy, việc giải nén video ở phía nhận cũng có thể được chuyển lên phần cứng để tăng tốc độ.

Việc truyền dữ liệu từ Sender đến Receiver được thực hiện thông qua các giao thức truyền video như HLS, MPEG-DASH, RTMP, RTP/RTSP. RTMP (phát triển bởi Adobe) vẫn đang là lựa chọn phổ biến cho hệ thống live streaming vì nó có thể đảm bảo được trễ thấp. HLS và MPEG-DASH là hai giao thức phổ biến cho trường hợp truyền on-demand (không trực tiếp). Tuy nhiên, nhiều kỹ thuật để giảm trễ cho HLS/MPEG-DASH đã và đang được triển khai.

Việc chạy video ở phía nhận hiện nay phổ biến nhất là sử dụng HTLM5 Video Tag vì nó cho phép chạy video ngay trong trình duyệt web mà không cần cài đặt thêm các plugin bên ngoài như Flash, VLC.

Phần tới sẽ phân tích về trễ của hệ thống live streaming so với hệ thống truyền hình.


Wednesday, February 13, 2019

Nhật ký xin việc (kỳ 1)


--- Thời gian biểu xin việc tại Nhật ----
  • Tháng 3 - Tháng 5: Các công ty bắt đầu cho entry, i.e, đăng ký thông tin cá nhân. Thông thường sẽ có hai dạng: 1. Đăng ký trực tiếp trên trang web công ty. 2. Đăng ký qua các trang xin việc như https://job.mynavi.jp
  • Tháng 3 - Tháng 5: 企業説明会: Giới thiệu về công ty. Hình thức phổ biến nhất là các job fairs, ngoài ra cũng sẽ có những công ty tổ chức ngay tại công ty đó. Nội dung chính là giới thiệu về công ty, và kế hoạch tuyển dụng.
  • Giữa tháng 3 - tháng 5: Các công ty bắt đầu nhận hồ sơ xin việc. Hồ sơ sẽ bao gồm sơ yếu lí lịch, thông tin PR bản thân, lý do lựa chọn công ty đó, việc muốn làm sau khi vào công ty. Sẽ có nhiều yêu cầu khác phụ thuộc vào từng công ty.
  • Tháng 6 - tháng 9: Kiểm tra năng lực và phỏng vấn. Giai đoạn này sẽ có nhiều phần: Coding, Aptitude Test, Situation Test, etc. Các công ty sẽ sử dụng các thứ tự khác nhau.
  • Tháng 10~: Nhận offer.
*Lưu ý:
  • Trong số các research labs của các công ty lớn (NTT, Toshiba, Hitachi, Panasonic, NEC, IBM Japan), NTT Research bắt đầu sớm nhất, nhận hồ sơ từ tháng 1.
  • Nhiều công ty hiện nay tuyển dụng quanh năm, bạn có thể tìm các jobs đang mở trên các trang như LinkedIn, Glassdoor, Wantedly. Đây là hai trang chuyên cho sinh viên PhD: JREC-IN, Wakate-engine.  

--- Tham gia Job Fairs ---

Mục đích tham gia job fairs là để tìm hiểu thông tin về công ty đó. Hình thức chính sẽ là các công ty làm presentation về công ty họ, sau đó sẽ cho thời gian để mình đặt câu hỏi.

Nếu bạn muốn tìm R&D jobs, phải chú ý khi một công ty đề cập đến cả việc làm Sytem Integrator (phần mềm) và R&D. Khi đó, cần hỏi rõ xem cụ thể phần SI chiếm bao nhiêu phần trăm, phần R&D chiếm bao nhiêu phần trăm. Các công ty nhỏ thì có thể trong phần giới thiệu công ty thì họ có đề cập đến việc R&D, rất nhiều nhân viên cũng là PhD/Master students, nhưng có thể chỉ là để PR.

Để tìm hiểu xem cụ thể công ty ấy làm gì, điểm mạnh và điểm yếu là gì, ngoài trang homepage của công ty đó, bạn nên tham khảo các trang web cung cấp feedbacks của nhân viên như: Glassdoor, Vorkers.

--- Làm hồ sơ xin việc ---

Một số câu hỏi thường gặp trong hồ sơ xin việc:

  • Hãy cho biết việc mà bạn đã dành nhiều công sức nhất trong thời gian đi học? Từ đó bạn học được những gì?
  • Điểm mạnh của bạn là gì?
  • Những kĩ năng chuyên môn của bạn là gì?
  • Tại sao bạn lại chọn công ty chúng tôi?
  • Bạn muốn làm gì sau khi vào công ty?
  • Hãy cho biết tin tức gần đây về công ty chúng tôi mà bạn quan tâm? Nêu lý do 

Để trả lời các câu hỏi trên bạn phải tìm hiểu kỹ về công ty định apply, trả lời được các câu hỏi sau sẽ giúp bạn hiểu rõ hơn về một công ty.

  • Vision của công ty là gì?
  • Công ty nằm ở sector nào? industry nào? 
  • Mô hình kinh doanh chính (business model) của công ty là gì?
  • Điểm mạnh của công ty là gì?
  • Các nhân viên của công ty này nói gì?


--- Phỏng vấn ---

Nội dung phỏng vấn của cty WAP cho vị trí AI Research Engineer

Phần 1: Hỏi đáp (15 phút)
 - Hãy giới thiệu ngắn ngọn về bản thân bạn?
 - Bạn đang làm nghiên cứu về topic nào? vấn đề mấu chốt là gì? làm cách nào để bạn giải quyết nó?
 - Bạn có kinh nghiệm gì về AI/ML?
 - Ngôn ngữ lập trình nào bạn thành thạo nhất? bạn bắt đầu lập trình từ khi nào?
 - Bạn đã từng tham gia vào các cuộc thi IT/programming nào?
 - Bạn đã từng tham gia vào hoạt động ngoại khóa nào?
 - Nghiên cứu của bạn có thể áp dụng được vào xử lý ngôn ngữ tự nhiên không?
 - Bạn có câu hỏi gì không?

Phần 2: Coding (45 phút)
 - Người phỏng vấn sẽ đưa ra một bài toán, yêu cầu mình phải viết code (trên bảng) để giải bài toán đó.
 - Yêu cầu là phải tìm ra thuật toán với độ phức tạp tính toán nhỏ nhất. Người phỏng vấn sẽ yêu cầu bạn xác định độ phức tạp tính toán của thuật toán mình viết, e.g., O(n).

Đề bài:
Cho hai dãy số tự nhiên bất kỳ, viết thuật toán đề tìm giá trị tuyệt đối nhỏ nhất của hiệu hai phần tử bất kỳ từu hai dãy số trên.

Ví dụ:
a  = [1 3 15 11]
b = [8 6 10 2]
output: 1

*Google cũng dùng cách này khi phỏng vấn:
link1: https://www.youtube.com/watch?v=uQdy914JRKQ
link2: https://www.youtube.com/watch?v=XKu_SEDAykw

* Trang này tập hợp bài test coding của rất nhiều công ty
https://practice.geeksforgeeks.org/company-tags



Sunday, February 10, 2019

Tech news (Week #6)

YouTube giới thiệu tính năng mới cho phép các nhà tạo nội dung (creators) kết hợp spatial audio với stereo audio. Người xem có thể sử dụng tính năng mới này trên trên ứng dụng YouTube mobile hoặc trên trình duyệt web. Spatial audio (3D audio) là tổng hợp của tất cả các âm thanh đến từ tất cả các hướng mà con người có thể nghe được, đây là dạng tự nhiên của âm thanh mà chúng ta vẫn nghe hàng ngày. Spatial audio là một thành phần quan trọng trong hệ thống thực tế ảo (Virtual Reality). Một trong những thử thách lớn trong việc tạo nội dung VR là việc thiết kế âm thanh (sound design) và tạo âm thanh 3D (spatial audio production). Với các nhà thiết kế âm thanh, nhiệm vụ quan trọng là phải kết hợp chính xác âm thanh trong không gian ba chiều với các vật thể trong video. Các nguồn âm thanh từ các vật thể trong video được gọi là "diegetic sound source". Bên cạnh đó, có những nguồn âm thanh không đến từ những vật trong video, ví dụ như nhạc nền và được gọi là "non-diegetic sound source". Hệ thống spatial audio rendering trong VR cần tái tạo một cách chính xác ý định của người thiết kế âm thanh. Để là được điều này, YouTube sử dụng hai thuật toán riêng biệt cho hai nguồn âm thanh (diegetic và non-diegetic).

Hulu giới thiệu tính năng Pause Ad với mục tiêu nhằm cải thiện trải nghiệm cho người dùng và tăng tính hiệu quả cho các nhãn hàng (brands). Với tính năng này, quảng cáo sẽ được hiển thị khi người dùng tạm dừng chương trình đang xem, thay vì hiển thị khi chương trình đang chạy như trước đây. Nghiên cứu của Hulu cho thấy rằng người dùng bây giờ khó chấp nhận quảng cáo khi đang xem chương trình. Vì vậy, tính năng mới này sẽ mang đến trải nghiệm tốt hơn cho người xem, đồng thời tăng tính hiệu quả cho các quảng cáo. Cách thức tiến hành quảng cáo mới này đang trong quá trình thử nghiệm với hai nhãn hàng lớn là Cocacola và Charmin.

[1] https://youtube-eng.googleblog.com/2018/12/add-stereo-music-or-narration-to-vr.html
[2] https://www.hulu.com/press/hulu-update/hulu-unveils-new-pause-ad-experience/



Friday, February 1, 2019

Tech news (Week #5)

Xu thế phát triển của trí tuệ nhân tạo Artificial Inteligent (AI)

Báo cáo mới nhất từ tổ chức sở hữu trí tuệ thế giới (WIPO) cho chúng ta biết về tình hình hiện tại và xu thế phát triển của AI
- AI đang đi từ nghiên cứu đến thực tiễn rất nhanh. Tỷ lệ công bố khoa học trên bằng sáng chế về AI đã giảm từ 8:1 vào năm 2010 xuống còn 3:1 vào năm 2016.
- Machine learning là công nghệ được chú trọng nhất, được đề cập đến trong hơn một phần ba số AI-related patents. Trong các kỹ thuật ML, deep learning và neural network là hai công nghệ có số lượng patent nhiều nhất. Deep learning là công nghệ phát triển nhanh nhất với số lượng patent tăng hơn 130% mỗi năm.
- computer vision là ứng dụng phổ biến nhất của AI với hơn một nửa số patent. Theo sau là robotics và các hệ thống điều khiển.
- AI đang phát triển mạnh nhất trong lĩnh vực telecommunication (15% số patent), tiếp theo là vận tải (15%), y tế (12%), tương tác người máy (Human-Computer Interaction).
- Phần lớn các patent được đăng ký bởi các công ty từ Mỹ, Nhật, và Trung Quốc. IBM sở hữu số patent nhiều nhất(~8000), theo sau là Microsoft (~6000). Ba công ty còn lại trong top 5 là Toshiba, Samsung, NEC với khoảng 5000 patents.
- Trung quốc có đến 17 trong top 20 trường đại học và các tổ chức nghiên cứu có nhiều patents nhất. Đứng đầu là Chinese Academy of Science, thứ hai là ETRI (Hàn).
- Khó khăn chính cho các start-up
 Phần lớn các startup hiện tại đang tập trung vào "vertical applications", tức là tìm các vấn đề yêu cầu đánh giá của con người, sử dụng các công nghệ AI để tìm ra giải pháp tự động hoá. các lĩnh vực tiềm năng là chế tạo, dịch vụ, bán lẻ. Tuy nhiên,  vốn đầu tư cho các startup hiện tại vẫn đang còn thiếu.
- Vấn đề công nghệ với AI
 các công nghệ AI hiện tại đang cần rất nhiều dữ liệu để training .  Tuy nhiên, rất nhiều vấn đề thực tế không có nhiều data. Ví dụ nếu muốn sử dụng AI để phát hiện sai sót trong sản phẩm, bạn phải có khả năng train với 100 hoặc thậm chí 10 mẫu. Đây vẫn là một thử thách lớn cho AI.




Vimeo thúc đẩy chiến lược "Push to social"

Vimeo thông báo rằng người dùng bây giờ có thể chia sẻ video trên Vimeo tới LinkedIn với chỉ một vài lần click chuột. Đây là bước tiếp theo trong chiến lược "Push to Social" mà dịch cụ chia sẻ video này đang theo đuổi. Bắt đầu từ năm 2017 bằng việc cung cấp dịch vụ live streaming,  "Push to Social" cho phép người dùng của Vimeo đưa video lên các mạng xã hội một cách dễ dàng. Vimeo hiện tại đang hỗ trợ Facebook, Youtube, Twitter và gần nhất là LinkedIn.

Lịch sử hình thành và phát triển của Vimeo:
Ra đời năm 2007, Vimeo là dịch vụ upload và chia sẻ video cho các nhà làm phim độc lập (indie filmmakers). Khác với Youtube, video trên Vimeo không có quảng cáo, nhưng bạn phải trả tiền hàng tháng. Số lượng videos có thể upload cũng bị hạn chế.  Điểm mạnh của Vimeo là nó hỗ trợ creators tạo ra video chất lượng cao (nhiều người có thể cùng edit một video, chất lượng hình ảnh được nâng cao với các công nghệ như HDR)

References
[1] WIPO Technology Trends 2019: Artificial Intelligence, https://www.wipo.int › wipo_pub_1055
[2]
http://www.streamingmedia.com/Articles/Editorial/Featured-Articles/How-Vimeo-Pivoted-Away-From-Original-Content-and-Found-its-Niche-129733.aspx



Sunday, January 27, 2019

Book review: Innovation in China


Quyển sách này trình bày và phân tích tình hình phát triển công nghệ đang diễn ra ở Trung Quốc. Từ một quốc gia chuyên đi copy sản phẩm từ những nước khác, Trung Quốc đang phát triển mạnh mẽ và đóng vai trò dẫn đường trong rất nhiều ngành công nghệ mới như trí tuệ nhân tạo, Big Data, thương mại điện tử. Tác giả cho rằng cuộc chiến tranh thương mại của Mỹ nhắm vào Trung Quốc gần đây nhằm mục đích làm chậm lại quá trình phát triển của Trung Quốc. Tuy nhiên, khi nhìn vào những gì đang điễn ra ở Trung Quốc, tôi nghĩ nó khó có thể gây cản trở đến quá trình phát triển công nghệ đang điễn ra một cách mạnh mẽ ở đây.

Điều này đạt được từ nỗ lực của các doanh nghiệp và chính phủ. Với các kế hoạch như "Made in China 2025", chính phủ Trung Quốc tạo điều kiện tối đa cho các doanh nghiệp phát triển các công nghệ tiên tiến như trí tuệ nhân tạo (AI), xe tự lái (Autonomous Car), Big Data, xe điện (electric car). Một môi trường cạnh tranh lành mạnh được tạo ra, thúc đẩy các công ty tạo ra những sản phẩm tốt hơn cho người dùng. Các nhà làm luật cũng đồng hành với bước tiến của công nghệ, tạo điều điện cho các công nghệ mới như thanh toán online, ngân hàng online phát triển.

Cuốn sách giới thiệu một số lượng lớn các startup thành công trong nhiều lĩnh vực của Trung Quốc. Nổi bật nhất phải kể đến hai tên tuổi lớn nhất là Alibaba Group và Tencent. Quá trình hình thành, phát triển, cách họ vượt qua những rào cản và các đối thủ cạnh tranh để trở thành những doanh nghiệp thành công được phân tích một cách chi tiết. Đều bắt đầu từ những start-up nhỏ, cả Alibaba và Tencent đã phát triển thành những nền tảng lớn với hàng trăm triệu người dùng. Một nhân tố quan trọng được chỉ ra trong thành công của cả hai công ty là tính năng thanh toán qua điện thoại (Mobile payment) Alipay và Wechat pay. Trong khi Alibaba đã khiến cho eBay phải rút lui khỏi thị trường thì WeChat (Tencent) đã vượt qua Microsoft để trở thành mạng xã hội phổ biến nhất ở Trung Quốc. Hiện tại, trong khi Tencent đang biến mình thành một nền tảng (platform) để giúp kết nối người sử dụng và doanh nghiệp thông qua mạng xã hội WeChat, Alibaba đang đầu tư vào nhiều lĩnh vực mới bên cạnh thương mai điện tử như ngân hàng, nông nghiệp, mở rộng thị trường ra nước ngoài như Ấn Độ, Malaysia.

Thế hệ start-up mới ở Trung Quốc đang tập trung vào các công nghệ hot nhất hiện nay như Ride sharing (DiDi), tài chính (WeBank), trí tuệ nhân tạo (Seneye, Face++, iFlytek). Điểm chung của các start-up này là họ sở hữu một nguồn nhân lực chất lượng cao từ các trường đại học danh tiếng cả ở trong và ngoài nước. Họ cũng nhận được đầu tư lớn từ các quỹ đầu từ và các đại gia công nghệ trên thế giới. Với thị trường khổng lồ, các start-up thành công sẽ trở thành những công ty tầm cỡ thế giới chỉ trong từ 2-3 năm.

Năm 2022 nhìn lại

Một năm bận rộn cũng sắp kết thúc. Để bố kể cho Sóc nghe về năm nay của nhà mình nhé. Nửa đầu năm là thời gian mà cả bố mẹ đều lao đầu vào c...