Gặp gỡ team Magestore tại series 'Chân chất kể tất - Webinar #9: "Thu hút nhân tài thời 4.0 nhờ chiến lược Inbound Recruiting"
Đăng ký tham gia!

Hiểu đúng về Data Science để nắm bắt cơ hội

Được mệnh danh là “the sexiest job in the future" nhưng lại có rất nhiều hiểu nhầm về Data Science. Hãy khám phá lát cắt của lĩnh vực mới này trong Ngành Bán Lẻ cùng Magestore.
Nội dung chính

Được mệnh danh là “the sexiest job in the future", Data Science tốn không ít giấy mực của các nhà phân tích để giải thích hiểu cho đúng ngọn nguồn. Quả là một khái niệm ai cũng nói mà không phải ai cũng hiểu.  Trong buổi Innovation Day 2020 diễn ra tại Viện Công nghệ thông tin  - SOICT - Trường ĐH Bách Khoa Hà Nội, anh Alex Nguyễn - CTO của Magestore và cũng đang là Product Owner của sản phẩm Retail Assistant tại Magestore đã có những chia sẻ cực kỳ thiết thực về Data Science. Hiểu sao cho đúng để từ đó ứng dụng cho hiệu quả, cũng như hiểu sao cho đúng để lựa chọn nghề nghiệp sao cho phù hợp. 

Bắt đầu bài nói của mình, anh Alex đã lấy ví dụ về một khách hàng tại Magestore tại Kazakhstan. Khách hàng là một ông lớn bán lẻ truyền thống được thành lập từ năm 1992, hiện nay đang sở hữu 80 stores và 20 kho hàng trên toàn quốc. Họ có tới 10,000 đơn hàng mỗi ngày. Tổng lượng sản phẩm (SKU) là 60,000. 


Câu hỏi liên tục dành cho nhóm quản lý của brand bán lẻ này, đó là: 

  • Cửa hàng chúng tôi cần mua những mặt hàng gì? 
  • Mỗi mặt hàng chúng tôi cần dự trữ bao nhiêu hàng để phù hợp với tốc độ bán hàng. 

Giả sử nhà bán lẻ có một nhóm chuyên tâm vào việc xử lý dữ liệu trên Excel, hãy tưởng tượng họ sẽ mất bao lâu, liệu có sai phạm hay không, và nếu sản lượng bán hàng ngày càng tăng, họ có trụ được theo cách tính toán này. 

Câu chuyện về nhà bán lẻ ở trên, là một trong số nhiều kịch bản của khách hàng bán lẻ lớn khi tìm đến Magestore. Chắc chắn, nếu có một giải pháp Data Science, khách hàng này sẽ giải quyết được bài toán của mình. 

Data Science bao gồm những gì? 

5 mảng chính của Data Science

Data Science bao gồm 5 mảng lớn như hình vẽ sau đây, trong đó: 

  • Visualization: Hiển thị dữ liệu 
  • Domain Expertise: Sự am hiểu dữ liệu ngành để khai thác những insights có ý nghĩa từ tập dữ liệu khổng lồ
  • Statistics: Xác suất & Dữ liệu thống kê 
  • Data Engineering: Xử lý bài toán lấy dữ liệu khách hàng chuyển về một nơi thống nhất, cấu trúc ra sao để truy vấn được nhanh nhất. 
  • Advanced Computing: Bộ xử lý tính toán dựa trên các platform. 

Phân biệt Data Engineering & Data Science 

Có nhiều sự hiểu nhầm lẫn giữa Data Engineering và Data Science. Data science là một khái niệm rộng hơn, nhấn mạnh đến các công nghệ chuyên sâu để phân tích dữ liệu như Machine Learning, AI… Trong khi đó Data Engineer nghiêng nhiều về các xử lý tính toán. 

Báo cáo về các kỹ năng của nghề trên Linkedin đã chỉ ra sự khác biệt rõ ràng giữa Software Engineer, Data Engineer và Data Scientist mà bạn có thể tham khảo thêm. 

Data Engineer

Là người xây dựng systems tổng hợp, lưu trữ và xuất dữ liệu từ một số app và system tạo ra bởi software engineers. Data engineer sở hữu một ngách kĩ năng của software engineer. 40% data engineer ban đầu là software engineer, đây là một trong những hướng phát triển nghề nghiệp thường thấy.

Công việc của vai trò này bao gồm:

  • Cấu trúc dữ liệu nâng cao
  • Điện toán phân tán (distributed computing)
  • Lập trình đồng thời (concurrent programming)
  • Kiến thức về một số công cụ mới: Hadoop, Spark, Kafka, Hive, v.v.
  • Tạo ETL/data pipelines

Data Scientist

Là người tạo hệ thống phân tích trên toàn bộ data, đó có thể là mẫu phân tích 1 lần để team hiểu về hành vi người dùng, hoặc thuật toán machine learning để implement vào code base của software engineers và data engineers.

Công việc của vai trò này bao gồm:

  • Data modeling
  • Machine learning
  • Thuật toán
  • Business Intelligence dashboards

Phân biệt Data Science và Business Intelligence 

Sự khác biệt giữa Data Scientist và Data Engineer thường gặp trong những thắc mắc về công việc và lựa chọn nghề nghiệp. Còn đứng trên cương vị của một nhà bán lẻ, họ sẽ thắc mắc Data Science thì có khác gì với Business Intelligence (BI). Như tại Việt Nam, nhiều nhà bán lẻ cũng sử dụng những báo cáo chuyên dụng cho BI, hoặc thành lập hẳn các team chuyên phân tích dữ liệu doanh nghiệp BI. 

Từ sự so sánh trên, có thể thấy Data Science là một cấp độ cao hơn của BI, trong đó xử lý cả những dữ liệu structured & unstructured. Từ dữ liệu đã có, đưa ra những phán đoán về hiện tại và tương lai, nhiều hơn là sự diễn giải điều gì đã xảy ra trong BI. 

Áp dụng Data Science vào khâu nào trong bán lẻ? 

Bắt nguồn từ dữ liệu quan trọng của bán lẻ. Theo bạn bán lẻ có những nguồn dữ liệu nào quan trọng nhất? Đó chính là dữ liệu bán hàng & dữ liệu tồn kho. 2 trụ cột, 2 xương sống chính của bán lẻ. Data Science không thay đổi bản chất quản trị hiện tại của nhà bán lẻ, mà sẽ thêm vào một lớp xử lý và phân tích dữ liệu dựa trên những gì đã có. Trở lại câu chuyện của nhà bán lẻ điện máy Kazakhstan, đây là những gì Magestore đã tư vấn cho họ. 

Toàn bộ phần Head Office & Distribution Center, cũng như phần Back Office Operation vẫn được quản lý một cách bình thường tại hệ thống ERP chủ lực 1C ERP của ho. Tuy nhiên các dữ liệu sẽ đẩy sang 1 tầng Controller để xử lý các tính toán và đưa ra những gợi ý cho phù hợp. 

  • Mua hàng bao nhiêu và đẩy vào từng warehouse như thế nào 
  • Mua hàng bao nhiêu và đẩy vào từng cửa hàng như thế nào 
  • Luân chuyển hàng hoá giữa các cửa hàng như thế nào để tối ưu chi phí vận hành và tăng hiệu quả bán hàng 

Hãy tưởng tượng khi kết lại một ngày làm việc vào buổi tối, máy tính & hệ thống Data Science sẽ xử lý dữ liệu cho bạn ngay trong đêm & rạng sáng, để bắt đầu ngày mới, team vận hành đã có những dữ liệu đáng quý. Ví dụ một process liên quan đến việc nhập hàng - nghiệp vụ Replenishment 

Bạn đã bao giờ hình dung 4 cấp độ của xử lý dữ liệu & phân tích dữ liệu trông ra sao trong bán lẻ thực tế. Từ việc giải thích What happened, Why did it happen, What will happen và What should I do? Hình ảnh sau đây sẽ cho bạn một cái nhìn tổng thể về việc áp dụng Data Science trong bán lẻ: Customers, Products & Channel. 

Một kịch bản bán lẻ chi tiết

1.What happened?

A.Store A sales decreased 15% vs same day last year

2.Why did it happen?

A.Sales of key department decreased 20% due to key products out of stock. The key products contributes 30% of department sales

B.Number of customers (invoices) decreased 15% due to heavy rain yesterday

3.What will happen?

A.Suppliers can’t deliver incoming orders of these key products within this week

→ Sales continues decreasing 18% next week

4.What should I do?

A.Find & purchase the alternative products to store.

B.Create the promotion and display new items at the island and the entrances.

Concept của Magestore về việc hiểu đúng Data Science không phải nằm ở việc viết thêm và giải thích thêm, mà là kỹ thuật reflect đưa Data Science vào hoạt động bán lẻ để xem thực tế, đứng từ khía cạnh người chủ business bán lẻ, họ sẽ tận dụng và sử dụng các dữ liệu phân tích như thế nào. 

Click để nghe phần thuyết trình của anh Alex Nguyễn - CTO Magestore về Data Science tại Innovation Day - ĐH Bách Khoa Hà Nội ngày 13/6/2020 vừa qua.

Bạn có háo hức trở thành một thành phần trong team của Magestore mang công nghệ Data Science đến các nhà bán lẻ? Hiện nay Magestore đang tìm kiếm những bạn sinh viên phù hợp với trình độ & định hướng trong phần Xử lý dữ liệu - Data Engineering (chính là khu vực màu xanh ở hình dưới đây  nhé) 

Hãy chat và ứng tuyển ngay với Magestore nhé các bạn!


Về chung một nhà với Magestore

More Articles