Bảo lưu là gì? Các quy định cần biết về bảo lưu học tập đối với sinh viên
Bảo lưu là gì? Các quy định cần biết về bảo lưu học tập đối với sinh viên
Nhìn vào nhánh Data Science, hầu hết mọi người sẽ nói rằng Data Science = Machine Learning. Tuy nhiên trên thực tế, Machine Learning (hoặc Modeling) sẽ chỉ chiếm khoảng 20% trong workload của một Data Scientist. Phần trăm công việc của Data Scientist được phân chia như sau:
Data scientist sẽ dựa vào phân tích dự đoán, học máy, điều hòa dữ liệu, mô hình toán học và phân tích thống kê. Một chuyên gia dữ liệu sẽ tiến hành xử lý khối lượng dữ liệu lớn theo quy trình như sau:
Mặc dù sự hiểu nhầm trên gần như đã phổ biến ở mọi nơi, việc xây dựng các mô hình máy học Machine Learning models chỉ là một bước của cả quá trình workload của một nhà khoa học dữ liệu. Sau khi đầu ra mô hình xử lý hậu kỳ, Data scientist sẽ truyền đạt kết quả cho các nhà quản lý, thường sử dụng các phương tiện trực quan hóa dữ liệu. Khi kết quả được thông qua, nhà khoa học dữ liệu đảm bảo công việc được tự động hóa và được phân phối một cách thường xuyên.
Nói tóm lại, người làm Data Scientist sẽ bao gồm:
Data Analyst là một trong những vị trí luôn cần tại các công ty. Không khó để nhận thấy vai trò quan trọng của dữ liệu trong hầu hết các ngành nghề, các tổ chức doanh nghiệp, từ sản xuất, kinh doanh, marketing cho tới các lĩnh vực về y tế, chăm sóc sức khỏe.
Khoản 1 Điều 15 của Thông tư 08/2021/TT-BGDĐT quy định về các trường hợp được xét bảo lưu kết quả học tập, cụ thể như sau:
Sinh viên có giấy điều động tham gia lực lượng vũ trang.
Được cơ quan có thẩm quyền điều động hoặc tham gia các giải thi đấu quốc tế như olympic, học sinh giỏi,...
Phải nghỉ để đảm bảo các vấn đề về sức khỏe có giấy chứng nhận của cơ quan y tế có thẩm quyền.
Vì các lý do cá nhân, nhưng cá nhân đó đã phải học tập ít nhất 1 kỳ trở lên tại cơ sở đào tạo và không thuộc vào các trường hợp bị xem xét thôi học, kỷ luật.
Tin vui cho tất cả những người đang bước vào ngành Data Science: Đường learning curve của ngành này không còn quá dốc nữa – đường vào nghề ở thời điểm hiện tại đơn giản hơn ngày xưa rất nhiều. Từ bất kì background nào bạn cũng có thể vào lĩnh vực này, đương nhiên phải kiên trì học nhiều – hiểu nhiều – cày nhiều, nhưng có thể đi chậm và chắc từ những cái căn bản.
Python mãi xứng đáng có một vị trí cao ổn định trong bộ toolkit của một Data Scientist. Nhiều chuyên gia chọn ngôn ngữ này vì hệ sinh thái được thiết kế đặc biệt cho khoa học dữ liệu. Python có cộng đồng phân tích dữ liệu lớn nhất, sẽ dễ dàng tìm thấy các ví dụ về phân tích trong Kaggle, tìm các ví dụ mã trong Stackoverflow (trang web hỏi đáp với hầu hết người mới bắt đầu và thường nâng cao câu hỏi là tốt) và cơ hội việc làm vì nó là ngôn ngữ phổ biến nhất trên thị trường.
Việc “nói cùng ngôn ngữ với database” là điều cần thiết cho các nhà khoa học dữ liệu. Bạn sẽ cần phải thành thạo SQL (xem thêm SQL là gì?) để có thể lấy thông tin từ cơ sở dữ liệu bằng cách sử dụng các hướng dẫn truy vấn mà không cần phải nối mã tùy chỉnh.
Với nhiều tính năng đặc biệt, R là ngôn ngữ được “làm thủ công” dành riêng cho data science và là khởi đầu cần thiết cho các Data Scientist năm 2020. Mọi thông tin và vấn đề số liệu sẽ được xử lý bằng R.
Mặc dù kiến thức về công cụ này là không bắt buộc, nhưng Hadoop làm tăng giá trị và khả năng chuyên môn của một nhà khoa học dữ liệu, đặc biệt nếu họ có kinh nghiệm với Hive hoặc Pig. Các công cụ đám mây như Amazon S3 cũng có thể giúp ích rất nhiều.
Không có cách nào để trốn được Machine Learning (xem thêm Machine Learning là gì?) đâu, bạn chắc chắn phải hiểu hết những điều cơ bản của ML. Điều này cung cấp cho bạn một kiến thức khổng lồ để hiểu cách các mô hình khác nhau hoạt động bên trong và thậm chí nghĩ về mô hình tốt hơn cho từng vấn đề.
Có nhiều kỹ thuật phổ biến cho hầu hết mọi mô hình và bạn nên học các kỹ thuật này trước và chỉ sau đó tập trung vào tìm hiểu sự khác biệt toán học và chi tiết triển khai của chúng.
Phần tốt nhất, quan trọng nhất và không may là khó nhất để cuối cùng – Thống kê. Chính kỹ năng này sẽ phân biệt là Data scientist và Machine Learning Engineer. Không có đường tắt ở đây. Bạn nên bắt đầu với thống kê mô tả, biết cách thực hiện phân tích dữ liệu khám phá tốt (EDA) hoặc tối thiểu là các khái niệm cơ bản về xác suất và suy luận, hiểu rõ các khái niệm về sai lệch lựa chọn, Nghịch lý Simpson, liên kết các biến (cụ thể là phương pháp phân tách phương sai ), những điều cơ bản của suy luận thống kê (và thử nghiệm A / B nổi tiếng như suy luận được biết đến trên thị trường), và một ý tưởng cho thiết kế thử nghiệm.
Công nhận kết quả học tập được quy định cụ thể và rõ ràng tại Khoản 4 Điều 15 và Điều 13 Thông tư 08/2021/TT-BGDĐT.
Theo đó, sinh viên được xem xét công nhận kết quả học tập, bao gồm các tiêu chí sau:
Việc công nhận, chuyển đổi tín chỉ của các học phần theo khóa đào tạo tại cơ sở đào tạo hiện tại dựa trên kết quả học tập của việc tích lũy của các trình độ, các chương trình, các ngành, các khóa học hoặc của một cơ sở đào tạo khác.
Cơ sở đào tạo quy định về việc xem xét, công nhận, chuyển đối tín chỉ trên cơ sở so sánh đầu ra, khối lượng học tập, nội dung học tập, cách thức đánh giá học phần và các điều kiện đảm bảo chất lượng đào tạo của cơ sở, khóa học, chương trình, ngành, trình độ đào tạo trước đó theo các cấp độ như sau: theo từng học phần, theo từng nhóm học phần, theo chương trình đào tạo.
Cơ sở đào tạo công khai về các quy định công nhận, chuyển đổi kết quả học tập, tín chỉ. Khối lượng tối đa được công nhận về kết quả học tập, chuyển đổi tín chỉ không vượt quá 50% về khối lượng tối thiểu cần học tập ở cơ sở đào tạo đó.
Riêng đối với ngành sư phạm cần tuân theo quy định của Bộ Giáo dục và Đào tạo.
Từ các quy định nói trên, việc bảo lưu không ảnh hưởng đến kết quả học tập của các sinh viên và sinh viên bảo lưu vẫn được công nhận kết quả học tập như sinh viên thường.
“Tháp workflow” của bộ phận Data Science
Tuỳ thuộc vào quy mô và mô hình doanh nghiệp, mỗi vị trí tại mỗi tổ chức sẽ có vai trò và trách nhiệm khác nhau. Tuy nhiên, mô hình tổng quan nhất về sự khác nhau của bộ ba Data như sau:
Các nhà khoa học dữ liệu phải có một nền tảng toán học và thống kê. Họ cũng hiểu và thành thạo việc tạo ra các mô hình máy học và trí tuệ nhân tạo. Việc tìm kiếm Data Scientist của doanh nghiệp cũng như tìm kiếm một Full-stacker và đòi hỏi nhiều thời gian.
Có thể gọi họ là loại kiến trúc sư dữ liệu. Kỹ sư dữ liệu thường có kỹ thuật máy tính hoặc nền tảng khoa học và kỹ năng tạo hệ thống.
Do đó, chúng ta có thể thấy rằng phạm vi công việc của các nhà phân tích dữ liệu nhằm phân tích và mô tả các chiến lược trong quá khứ hoặc trước đó dựa trên dữ liệu quá khứ hoặc hiện tại, trong khi các nhà khoa học dữ liệu tập trung vào việc dự đoán và tính toán trước để tạo ra các chiến lược trong tương lai.
Đây là vị trí Data Analyst làm việc trong ngành bảo hiểm – với lượng lớn dữ liệu, nhiệm vụ của Actuary là tính toán về rủi ro, chi phí, đảm bảo lợi nhuận cho công ty.