-
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathpost.sql
124 lines (108 loc) · 179 KB
/
post.sql
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
-- phpMyAdmin SQL Dump
-- version 5.1.1
-- https://www.phpmyadmin.net/
--
-- Máy chủ: 127.0.0.1
-- Thời gian đã tạo: Th5 16, 2022 lúc 05:46 AM
-- Phiên bản máy phục vụ: 10.4.22-MariaDB
-- Phiên bản PHP: 8.0.15
SET SQL_MODE = "NO_AUTO_VALUE_ON_ZERO";
START TRANSACTION;
SET time_zone = "+00:00";
/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8mb4 */;
--
-- Cơ sở dữ liệu: `weblog`
--
-- --------------------------------------------------------
--
-- Cấu trúc bảng cho bảng `post`
--
CREATE TABLE `post` (
`post_id` bigint(20) NOT NULL,
`post_title` varchar(60) COLLATE utf8_unicode_ci NOT NULL,
`slug` varchar(100) COLLATE utf8_unicode_ci NOT NULL,
`thumbnail` varchar(70) COLLATE utf8_unicode_ci NOT NULL,
`summary` text COLLATE utf8_unicode_ci DEFAULT NULL,
`updatedAt` datetime NOT NULL,
`published` tinyint(1) NOT NULL,
`publishedAt` datetime NOT NULL,
`content` longtext COLLATE utf8_unicode_ci NOT NULL,
`user_id` bigint(20) NOT NULL,
`viewcount` int(11) DEFAULT NULL,
`category_id` bigint(20) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;
--
-- Đang đổ dữ liệu cho bảng `post`
--
INSERT INTO `post` (`post_id`, `post_title`, `slug`, `thumbnail`, `summary`, `updatedAt`, `published`, `publishedAt`, `content`, `user_id`, `viewcount`, `category_id`) VALUES
(6, 'Món nướng ngon nhất vào ngày Chủ nhật ở Cotswolds', 'mon-nuong-ngon-nhat-vao-chu-nhat-cotswolds', 'mon-nuong-cotswolds.jpg', 'Được tổ chức bởi một đôi vợ chồng, The Old Bakery Tearoom mang đến khung cảnh ấm cúng và dễ chịu để thưởng thức bữa sáng. Chọn từ các món ăn cổ điển của Anh như bánh nướng nướng, trứng trên bánh mì nướng hoặc bánh mì nướng nóng, ăn kèm với các lát bơ. Họ thậm chí còn phục vụ cốc của Horlicks! Phần tốt nhất? Thực đơn bữa sáng được phục vụ cả ngày. Nếu bạn đang tìm kiếm một nơi nào đó ấm cúng và giản dị như bà của bạn, đây là nơi.', '2022-03-20 16:38:59', 0, '2022-05-10 00:00:00', 'Mở cửa chỉ vài năm trước đây vào năm 2014, Boston Tea Party là một địa điểm nổi tiếng nằm trên Phố Clarence nhộn nhịp ở Cheltenham. Mặc dù về mặt kỹ thuật một chuỗi tây nam, quán cà phê có một cảm giác rõ ràng địa phương với nó, và các nhân viên thân thiện và có sức chứa chắc chắn sẽ làm cho bạn cảm thấy được chào đón. Nơi này vô cùng bận rộn vào cuối tuần, và với lý do chính đáng - thức ăn thật tuyệt vời! Có một cung cấp rộng lớn cho sức khỏe có ý thức, chẳng hạn như bơ đập vào lúa mạch đen, cháo gạo nâu và granola đánh vần, cũng như các món ăn truyền thống hơn như bữa ăn sáng miền tây nước. Nếu bạn cảm thấy đói, hãy thử dùng hàm băm ngọt - bạn sẽ không hối tiếc.\r\n\r\nNếu bạn đang thưởng thức bữa sáng kiểu Anh đúng kiểu với sự rung cảm truyền thống của Anh, bạn đã tìm được đúng chỗ trong quán rượu tuyệt đẹp từ thế kỷ 16 này. Chọn từ một thực đơn đơn giản nhưng đặc biệt, bao gồm các món ăn cổ điển như trứng luộc và binh lính, một tiếng Anh đầy đủ, cà chua và nấm trên bánh mì nướng và kippers nướng, tất cả rửa sạch với cà phê mới pha \'Cotswold\'.\r\n\r\nVới thực tế rằng họ sử dụng nguyên liệu nguồn gốc địa phương như dấu ấn của họ, The Country Bếp sử dụng trứng từ một trang trại ít hơn 5 dặm xuống đường. Với một cung cấp mà sẽ trêu ngươi mỗi tastebud, đây là nơi hoàn hảo cho bữa ăn nửa buổi với bạn bè vào một thứ bảy lười biếng. Nếu các tùy chọn khác nhau của trứng, băm thịt bò brisket hoặc bữa ăn sáng chay là quá về phía savory cho bạn, sau đó không băn khoăn như lựa chọn tươi của họ của bánh quế là một món ăn không thể tránh được. Miệng của chúng tôi đang tưới nước theo ý nghĩ', 2, 0, 1),
(7, 'Cách mở Disk Management trên Windows 11', 'mo-disk-management-tren-windows-11', 'cach-mo-disk-management-win-11.jpg', 'Disk Management là một tiện ích có sẵn trên máy tính Windows, và có nhiều cách khác nhau để truy cập nó.', '2022-03-23 17:06:26', 0, '2022-05-02 00:00:00', 'Disk Management về cơ bản là một tiện ích cho phép người dùng quản lý toàn bộ phần cứng dựa trên ổ đĩa được Windows nhận diện. Hiểu theo cách đơn giản, Disk Management được sử dụng để quản lý các ổ đĩa được cài đặt trong máy tính như ổ cứng (bên trong và bên ngoài), ổ đĩa quang và ổ flash. Nó có thể được sử dụng để phân vùng, định dạng, gán ký tự ổ đĩa, và nhiều thứ khác nữa.\r\n\r\nDisk Management là một tiện ích có sẵn trên máy tính Windows, và có nhiều cách khác nhau để truy cập nó. Bài viết này sẽ hướng dẫn bạn các cách mở Disk Management trên Windows 11.', 2, 0, 6),
(9, 'Cách sử dụng Narrator trên Windows 11', 'su-dung-narrator-tren-windows-11', 'cach-cau-hinh-cai-dat-narrator.png', 'Kể từ khi phát hành Windows 11, nhiều tính năng trợ năng đã được nâng cấp đáng kể. Các tính năng mới (chẳng hạn như giọng nói tự nhiên hơn) làm cho', '2022-03-22 17:09:18', 1, '2022-03-20 17:09:18', 'Windows Narrator đã tồn tại như một tính năng trợ năng cần thiết trong một thời gian dài. Nó giúp người dùng điều hướng các trang web, ứng dụng Windows, v.v… bằng cách đọc văn bản trên màn hình.\r\n\r\nKể từ khi phát hành Windows 11, nhiều tính năng trợ năng đã được nâng cấp đáng kể. Các tính năng mới (chẳng hạn như giọng nói tự nhiên hơn) làm cho Narrator trở nên mạnh mẽ và có thể tùy chỉnh nhiều hơn trên Windows 11.\r\n\r\nSau đây là tất cả những gì bạn cần biết về cách thiết lập và sử dụng Narrator trên Windows 11.', 2, 0, 6),
(10, 'Windows Narrator đã tồn tại như một tính năng trợ năng cần t', 'tang-do-nhay-ban-di-chuot-tren-laptop-windows-11', 'cach-cau-hinh-cai-dat-narrator.png', 'Bàn di chuột (touchpad) là thành phần không thể thiếu trên bất cứ chiếc laptop nào.', '2022-03-23 17:10:18', 0, '2022-03-20 17:10:18', 'Bàn di chuột (touchpad) là thành phần không thể thiếu trên bất cứ chiếc laptop nào. Touchpad hỗ trợ nhiều cử chỉ chạm hữu ích mà bạn có thể sử dụng để thao tác với PC một cách dễ dàng. Chẳng hạn như trượt 2 ngón tay trên touchpad để cuộn trang, hoặc chụm mở đầu ngón tay để thu phóng màn hình và hàng loạt cử chỉ khác.\r\n\r\nNếu vừa mua một máy tính xách tay mới, bạn có thể nhận thấy rằng phản hồi mặc định của bàn di chuột có thể khá chậm. Một số người thích điều này. Tuy nhiên, nếu bạn muốn bàn di chuột của mình nhạy hơn, có thể tuỳ chỉnh điều đó một cách dễ dàng. Cùng tìm hiểu ngay sau đây.', 2, 0, 6),
(11, 'Cách xử lý lỗi Windows 11 không nhận đủ RAM', 'cach-xu-ly-khi-windows-11-loi-khong-nhan-du-ram', 'Sua-loi-windows-11-khong-nhan-du-ram-2.jpg', 'Windows 11 của bạn báo lỗi không nhận đủ RAM, thiếu RAM trong khi RAM của máy vẫn còn. Bài viết này sẽ giúp bạn xử lý tình huống này một cách nhanh chóng.', '2022-03-23 17:11:28', 1, '2022-03-20 17:11:28', 'RAM là một yếu tố vô cùng quan trọng giúp cho máy tính hoạt động trơn tru và hiệu quả. RAM càng cao thì máy tính của bạn sẽ chạy càng nhanh. Tuy nhiên việc gặp phải lỗi Windows 11 không nhận đủ RAM khá là phổ biến, gây trở ngại lớn trong quá trình sử dụng của người dùng.\r\n\r\nVậy đâu là giải pháp để xử lý lỗi không nhận đủ RAM trên Windows 11? Cùng đi tìm hiểu ngay nhé.', 2, 0, 6),
(12, 'Truy Kích cho máy tính', 'truy-kich', 'game-ban-sung-truy-kich-ra-mat-tai-viet-nam-26544-1.jpg', 'Truy Kích là trò chơi bắn súng góc nhìn thứ nhất với đồ họa 3D kế thừa những đặc tính giống như trên Đột Kích và Counter Strike.', '2022-03-23 17:12:57', 1, '2022-03-20 17:12:57', 'Truy Kích là trò chơi bắn súng góc nhìn thứ nhất với đồ họa 3D kế thừa những đặc tính giống như trên Đột Kích và Counter Strike. Với nhiều chế độ chơi đa dạng và thậm chí là có cả chế độ Battle Royale như trong PUBG Mobile PC hay Free Fire PC. Game được Wooduan Entertainment phát hành, và được VTC Mobile mua bản quyền phát hành tại Việt Nam.\r\n\r\nKhác với những tựa game PC khác, bạn sẽ trải nghiệm Truy Kích trên nền tảng web. Lợi thế khi chơi trên nền tảng này đó chính là bạn không cần phải cài đặt game, chỉ cần chờ game tải về tài nguyên là có thể chơi được.', 2, 0, 4),
(14, 'Nắp chai Coca-Cola màu vàng có ý nghĩa gì?', 'nap-chai-coca-cola-mau-vang-co-y-nghia-gi', 'Nap-chai-Coca-mau-vang-1.jpg', 'Dù bạn có phải là người hay uống Coca-Cola hay không. Bạn sẽ ngay lập tức nhận ra màu đỏ và chữ trắng trên mọi chai nước uống Coca-Cola. Và trên nắp cũng có màu sắc và dòng chữ biểu tượng của hãng.\r\n\r\nCho đến khi bạn đến một cửa hàng và đi đến quầy nước ngọt, có thể bạn sẽ thấy một nắp chai Coca-cola màu vàng.', '2022-03-20 17:14:57', 1, '2022-03-20 17:14:57', 'Những chiếc nắp chai màu vàng Coca-cola thường chỉ có trên những loại chai 1.5 lít. Đó không phải là lỗi xảy ra trong quá trình sản xuất, và chúng không xuất hiện thường xuyên. Đây là những chai Coca-cola chỉ xuất hiện ở những dịp đặc biệt.\r\n\r\nVậy trong những chai Coca nắp màu vàng là gì?\r\nChúng không chỉ đơn giản là mang tính thẩm mỹ, phần nắp màu vàng biểu thị rằng nước ngọt bên trong là Kosher - một đồ uống trong ngày Lễ Vượt Qua hoặc còn gọi là Lễ Quá Hải.\r\n\r\nTheo KLBD, một trong những cơ quan kosher hàng đầu thế giới thì Kosher trong tiếng Do Thái có nghĩa là \"thích hợp, phù hợp hoặc chính xác\". Từ này miêu tả chế độ ăn kiêng nghiêm ngặt trong đạo Do Thái.\r\nNhững người Do Thái theo chế độ ăn kiêng phải đảm bảo rằng họ chỉ ăn thịt, gia cầm và sữa từ động vật ăn kiêng và đã được chế biến theo cách riêng dành cho người ăn kiêng.\r\n\r\nCó một số quy tắc ăn kiêng đã được bổ sung trong kỳ nghỉ mùa xuân của Lễ Vượt qua. Trong Lễ Vượt Qua, người Do Thái không tiêu thụ thực phẩm có men hoặc đồ uống lên men có nguồn gốc từ lúa mì, lúa mạch, yến mạch, lúa mạch đen hoặc lúa mạch đen, theo KLBD.\r\n\r\nKosher được làm từ gì?\r\nMột số người cũng hạn chế ăn nhiều loại hạt, bao gồm cả ngô - và đó là lý do mà Coca-Cola xuất hiện.\r\n\r\nCoca-Cola truyền thống chứa một lượng si rô ngô có hàm lượng fructose (đường trái cây) cao được làm từ ngô. Cho nên, Coca-Cola đã tạo ra một phiên bản đặc biệt là “kosher cho Lễ Vượt Qua” có hương vị không phải từ ngô, chẳng hạn như đường mía hoặc đường củ cải, để cho phép mọi người thưởng thức một ly Coke trong kỳ nghỉ, theo tờ The New York Times .\r\nTrong một buổi tuyên bố với TODAY Food, Coca-Cola cho biết “Công ty Coca-Cola cung cấp các sản phẩm kosher quanh năm (KYR) và kosher cho Lễ Vượt Qua (KFP).”. Các sản phẩm Kosher cho Lễ Vượt Qua có thể tìm thấy tại một số thị trường được chọn lọc trong ngày Lễ Vượt qua của người Do Thái (ví dụ: 27 tháng 3 - 4 tháng 4 năm 2021).\r\n\r\nCông ty tiếp tục chia sẻ “Chỉ những thành phẩm mang biểu tượng của một trong những tổ chức Rabbinical được chỉ định mà chúng tôi hợp tác mới có thể được đảm bảo là Kosher, vì việc sản xuất được các tổ chức này giám sát thông qua toàn bộ quy trình sản xuất từ đầu đến cuối.”\r\nMột số người không phải người Do Thái cũng thích uống thức uống này vì nó là một sự khác biệt về hương vị của loại đồ uống này. Khi công ty sử dụng đường mía hoặc củ cải đường, thay vì si-rô ngô, làm chất tạo ngọt.\r\n\r\nPhiên bản Coca-cola nắp màu vàng này chỉ có trong trong Lễ Vượt Qua, và ngày lễ này sẽ kết thúc vào ngày 4 tháng 4 năm nay.', 2, 0, 3),
(15, 'Một số mẹo để bắt đầu với Machine Learning', 'mot-so-meo-de-bat-dau-voi-machine-learning', 'AI-Machine-Learning.jpg', 'Thực sự cần thiết để bắt đầu việc học về machine learning càng sớm càng tốt nếu bạn muốn không bị tụt hậu', '2022-03-23 03:39:33', 1, '2022-03-23 03:39:33', '<blockquote>Thực sự cần thiết để bắt đầu việc học về machine learning càng sớm càng tốt nếu bạn muốn không bị tụt hậu.<blockquote>\r\n\r\nAI và Machine Learning đã trở thành một trong những giải pháp có tác động mạnh mẽ đến các doanh nghiệp nhất hiện nay và chúng vẫn là một phần quan trọng trong chiến lược phát triển của các công ty công nghệ trong thời gian tới.\r\n\r\nCần phải hiểu rằng việc sử dụng Machine Mearning ( ML) để phát triển sản phẩm dần trở nên cần thiết – và nếu một công ty muốn đạt được mục tiêu của mình, họ sẽ tụt hậu so với các đối thủ cạnh tranh trong thập kỷ tới nếu họ không có ML. Vì vậy, cần bắt đầu tìm hiểu về ML càng sớm càng tốt. Nếu bạn sẵn sàng đạt được mục tiêu này, đây là một số mẹo để bắt đầu.\r\n\r\n<h2>Tạo ra liên kết giữa ML Operations và Data Science</h2>\r\nCó nhiều công ty hiểu về ML và data science, nhưng họ không biết làm thế nào để thực hiện. Việc tập trung vào cả hai và giữ chúng riêng biệt là không cần thiết. Bạn có thể đưa data science và các hoạt động ML\r\n\r\n<h2>Sẵn sàng cho các thử nghiệm mới</h2>\r\nVì đây là nỗ lực đầu tiên để ứng dụng ML vào hoạt động công ty, nên thử những thử nghiệm mới trong các lĩnh vực kinh doanh khác nhau, để học hỏi thêm những điều mới. Ngay khi bắt đầu chiến dịch, nếu bạn đang mong đợi thu được lợi nhuận ngay thì có lẽ bạn sẽ từ bỏ việc tìm hiểu ML ngay từ khi bắt đầu.\r\n\r\n<h2>Quản lý hiệu quả Data Servers</h2> \r\nDữ liệu của bạn như là một mặt hàng có giá trị sẽ giúp bạn đảm bảo rằng bạn không đưa ra quyết định vội vàng. Data Servers sẽ giúp thúc đẩy hiệu quả của ML, nhưng bạn cần phải quản lý và bảo vệ dữ liệu được cung cấp. Nhiệm vụ này không dễ dàng như tìm kiếm một lựa chọn lý tưởng để chuyển đổi YouTube sang MP3 – nó phức tạp hơn rất nhiều. Bạn cần phải cẩn trọng với quá trình này.\r\n\r\n<h2>Không vội vàng để giải quyết toàn bộ vấn đề cùng một lúc</h2>\r\nXây dựng một giải pháp theo thời gian là rất quan trọng, và vì thế, bạn cần có đầy đủ dữ liệu ở từng giai đoạn. Vì vậy, bạn không nên vội vàng để giải quyết toàn bộ vấn đề cùng một lúc. Bắt đầu bằng việc giải quyết phần nhỏ của vấn đề và đảm bảo rằng bạn thực hiện đầy đủ quy trình giải quyết vấn đề.\r\n\r\n<h2>Để team của bạn biết tầm quan trọng của ML và AI</h2>\r\nThúc đẩy ML và trí tuệ nhân tạo là rất quan trọng, và bạn cần phải bắt đầu bằng cách chỉ cho CEO và đảm bảo rằng chiến lược của họ về ML / AI được cải thiện theo thời gian. Hãy nhớ rằng một hoạt động ML thành công sẽ là chìa khóa cho tương lai thành công và nếu CEO không quan tâm đến ML và AI thì hãy cảnh báo với họ rằng sẽ không có nhiều thay đổi tích cực lớn đến công ty trong thời gian tới.', 2, 0, 8),
(16, '9 hiểu lầm “ngớ ngẩn” về machine learning', '9-hieu-lam-ngo-ngan-ve-machine-learning', 'AI-Machine-Learning.jpg', 'Những hiểu lầm và quan niệm lệch lạc về machine learning xuất hiện ngày càng nhiều do nó ngày càng bị cường điệu hoá...', '2022-03-23 03:46:18', 1, '2022-03-23 03:46:18', 'Những hiểu lầm và quan niệm lệch lạc về machine learning xuất hiện ngày càng nhiều do nó ngày càng bị cường điệu hoá. Bài viết này sẽ cho bạn một cái nhìn tổng quát về những gì machine learning có thể và không thể làm.\r\n\r\nMachine learning được tin rằng hữu ích đến nỗi nó có thể giải quyết mọi vấn đề và áp dụng trong mọi tình huống. Giống như các công cụ khác, machine learning rất hữu ích trong một số lĩnh vực cụ thể, đặc biệt đối với các vấn đề mà bạn thường xuyên gặp phải nhưng bạn biết rõ rằng bạn sẽ không bao giờ có thể thuê đủ người để giải quyết, hoặc đối với các vấn đề có mục tiêu nhưng không có phương pháp rõ ràng để đạt được nó.\r\n\r\nTuy nhiên, mỗi tổ chức thường áp dụng machine learning theo những cách khác nhau, như 42% những nhà điều hành cấp cao gần đây nói với Accenture rằng họ mong đợi AI sẽ đứng sau tất cả những đổi mới vào năm 2021. Nhưng bạn sẽ khai thác nó tốt hơn nếu bạn không bị ảnh hưởng bởi những luồng ý kiến cường điệu hoá và không quá tin vào những định kiến bằng cách hiểu những gì machine learning có thể và không thể thực hiện.\r\n\r\nTuyển dụng Machine Learning lương cao hấp dẫn cho bạn\r\n\r\n1. Machine learning cơ bản là AI\r\nMachine learning và AI thường được cho là hai từ đồng nghĩa, nhưng trong khi machine learning là kỹ thuật được sử dụng rất nhiều trong các phòng thí nghiệm, AI là một mảng lớn bao gồm các lĩnh vực như tầm nhìn máy tính, robot và xử lý ngôn ngữ tự nhiên, cũng như những cách tiếp cận khác như giảm sự hài lòng mà không bao gồm machine learning. Hãy suy nghĩ nó như những thứ làm cho máy móc trở nên thông minh hơn. Không phải lúc nào máy móc cũng sử dụng trí tuệ nhân tạo, thứ mà mọi người nghĩ có thể sẽ chiến đấu hoặc thậm chí tấn công loài người.\r\n\r\nHãy chú ý đến các thuật ngữ và sử dụng chúng thật chính xác. Machine learning là về học các mô hình và dự đoán các kết quả từ các tập dữ liệu lớn; các kết quả trông có vẻ ” thông minh” nhưng thật sự nó đang sử dụng các số liệu thống kê với tốc độ và quy mô chưa từng có.\r\n\r\n2. Tất cả các dữ liệu đều hữu ích\r\nBạn cần data cho machine learning, nhưng không phải tất cả dữ liệu đều hữu ích cho machine learning. Để đào tạo hệ thống của bạn, bạn cần những dữ liệu đại diện bao gồm các patterns và kết quả mà hệ thống machine learning của bạn cần phải xử lý. Bạn cần dữ liệu không có các patterns liên quan (chẳng hạn như các ảnh cho thấy tất cả những người đàn ông đứng lên và tất cả phụ nữ ngồi xuống, hoặc tất cả những chiếc xe đang ở trong ga-ra và tất cả những chiếc xe đạp đang ở trong một bãi lầy) bởi vì mô hình machine learning sẽ phản ánh những patterns cụ thể và tìm chúng trong dữ liệu bạn có. Tất cả những dữ liệu bạn sử dụng cho việc đào tạo nó cần phải được phân loại tốt, và dán nhãn các tính năng bạn hỏi machine learning, điều đó tốn rất nhiều công sức.\r\n\r\nĐừng nghĩ rằng dữ liệu bạn có luôn tốt, có thể đại diện cho phần đông hoặc có thể dễ dàng gắn nhãn.\r\n\r\n3. Bạn luôn cần nhiều data\r\nNhững cải tiến lớn đã được thực hiện gần đây về khả năng nhận diện hình ảnh, đọc hiểu của máy, dịch thuật và các lĩnh vực khác đã ra mắt nhờ có sự xuất hiện của các công cụ tốt hơn, computing hardware như GPUs có thể xử lý một số lượng lớn dữ liệu và những tập dữ liệu lớn đã được gắn nhãn, bao gồm ImageNet và tập dữ liệu Stanford Question Answering. Nhưng nhờ vào một mẹo gọi là transfer learning, bạn không phải lúc nào cũng cần một tập dữ liệu lớn để đạt được kết quả tốt trong một lĩnh vực cụ thể; thay vào đó, bạn có thể dạy hệ thống machine learning học cách sử dụng tập dữ liệu để nó dần có thể tự học với những tập dữ liệu nhỏ hơn. Đó là cách custom vision APIs từ Salesforce và Microsoft Azure hoạt động: Bạn chỉ cần 30-50 hình ảnh để chứng minh rằng bạn có thể phân loại nhằm có kết quả tốt hơn.\r\n\r\nTransfer learning cho phép bạn tùy chỉnh một hệ thống đã được đào tạo từ trước để giải quyết các vấn đề với lượng dữ liệu tương đối nhỏ.\r\n\r\n4. Bất kì ai cũng có thể xây dựng một hệ thống machine learning\r\nCó rất nhiều công cụ mã nguồn mở và framework dành riêng cho machine learning và có vô số các khóa học chỉ bạn cách sử dụng nó. Nhưng machine learning vẫn là một kĩ thuật chuyên ngành; bạn cần biết cách chuẩn bị dữ liệu và phân vùng cho việc đào tạo và testing, bạn cần biết cách chọn thuật toán tốt nhất và biết heuristics để sử dụng với nó, cách biến nó thành một hệ thống đáng tin cậy để sản xuất. Bạn cũng cần phải theo dõi hệ thống để đảm bảo rằng các kết quả được đồng bộ theo thời gian; cho dù thị trường có thay đổi hay hệ thống machine learning của bạn đủ tốt để phân loại các nhóm khách hàng khác nhau hay không, bạn cần tiếp tục kiểm tra để xem mô hình ấy vẫn còn phù hợp với vấn đề của bạn hay không.\r\n\r\nViệc tìm hiểu machine learning tốn rất nhiều thời gian; nếu bạn mới bắt đầu, hãy nghĩ đến APIs và các mô hình đã được đào tạo từ trước mà code của bạn có thể có trong khi bạn có hoặc thuê data science và chuyên gia machine learning để xây dựng các hệ thống tùy chỉnh.\r\n\r\n5. Tất cả các patterns trong data đều hữu ích\r\nNgười mắc bệnh suyễn, người bị đau ngực hoặc bệnh tim và bất kỳ ai trên 100 tuổi đều có tỉ lệ sống sót cao hơn những người bệnh bị viêm phổi. Trên thực tế, một hệ thống machine learning đơn giản được thiết kế để tự động nhập hồ sơ bệnh án có thể gửi chúng về tận nhà của bạn ( một hệ thống được huấn luyện trên cùng một dữ liệu với mạng lưới nơ-ron sẽ thực hiện những việc y chang nhau ). Lí do họ có tỉ lệ sống sót cao như thế là do họ luôn được ưu tiên nhập viện vì bệnh viêm phổi rất nguy hiểm.\r\n\r\nHệ thống đang tìm kiếm một pattern hợp lý trong dữ liệu; nó không phải là một pattern hữu ích để lựa chọn bệnh nhân vào viện ( mặc dù nó giúp công ty bảo hiểm dự đoán chi phí điều trị khá hiệu quả ). Thậm chí nguy hiểm hơn, bạn sẽ không biết rằng những patterns không hiệu quả ấy có trong tập dữ liệu của bạn trừ khi bạn đã biết về chúng.\r\n\r\nTrong các trường hợp khác, một hệ thống có thể học một pattern hợp lý ( như hệ thống nhận dạng khuôn mặt đang gây tranh cãi vì dự đoán chính xác xu hướng tình dục từ selfies) , nhưng nó không thực sự hiệu quả vì không có lời giải thích rõ ràng ( trong trường hợp các bức ảnh hiển thị các tín hiệu xã hội như pose chứ không phải hình tự nhiên).\r\n\r\nCác mô hình ” Black box ” rất hiệu quả nhưng chúng không làm rõ được chúng đã học được pattern nào. Các thuật toán thông minh như Generalized Additive Models có thể làm rõ được model đã học đươc gì để bạn quyết định xem nó có hữu ích để triển khai hay không.\r\n\r\n6. Reinforcement learning luôn sẵn sàng để sử dụng\r\nHầu như tất cả các hệ thống machine learning đang được sử dụng ngày nay đều sử dụng supervised learning; Trong nhiều trường hợp, chúng được đào tạo dựa trên các tập dữ liệu được gắn nhãn rõ ràng mà nhiều người đã cùng chuẩn bị. Quản lí các tập dữ liệu ấy mất rất nhiều thời gian và công sức, vì vậy các loại unsupervised learning được yêu thích hơn, đặc biệt là reinforcement learning (RL) – cách một agent học thông qua việc thử và sai, bằng cách tương tác với môi trường xung quanh và nhận thưởng khi có hành vi đúng. Hệ thống AlphaGo của DeepMind đã sử dụng RL bên cạnh supervised learning để đánh bại những người chơi Go hàng đầu, và Libratus, một hệ thống được xây dựng dựa trên một team ở Carnegie Mellon, đã sử dụng RL cùng hai kĩ thuật AI khác để đánh bại những người chơi poker hàng đầu trên thế giới tại Texas Hold’Em ( với chiến lược cá cược dài và phức tạp ). Các nhà nghiên cứu đang thử nghiệm RL với mọi thứ từ robot đến testing security software.\r\n\r\nTuy nhiên, RL chỉ phổ biến trong các trường hợp nghiên cứu. Google sử dụng DeepMind để tiết kiệm năng lượng trong các trung tâm dữ liệu của họ bằng việc làm mát chúng hiệu quả hơn; Microsoft sử dụng một phiên bản hạn chế của RL gọi là “ contextual bandits “ để cá nhân hoá các tiêu đề đối với các người dùng mới truy cập vào MSN.com. Vấn đề là chỉ có ít môi trường thực tế có phần thưởng và phản hồi tức thì, và đặc biệt là lừa gạt phần thưởng khi agent thực hiện nhiều hành động trước khi xảy ra bất cứ điều gì.\r\n\r\n7. Machine learning không thiên vị\r\nVì machine learning học từ dữ liệu, nó sẽ sao chép bất kỳ sai lệch nào trong tập dữ liệu. Tìm kiếm hình ảnh của CEO thường sẽ ra hình ảnh của nam CEO da trắng vì có nhiều CEO là người da trắng và là nam hơn những người còn lại. Nhưng machine learning làm các thiên hướng đã sai trở nên … càng sai hơn.\r\n\r\nTập dữ liệu COCO thường được sử dụng để huấn luyện hệ thống nhận dạng hình ảnh của cả nam và nữ; nhưng nhiều hình ảnh của phụ nữ sẽ được hiển thị bên cạnh thiết bị nhà bếp hơn và nhiều hình ảnh của đàn ông sẽ được hiển thị bên cạnh bàn phím máy tính và chuột hoặc vợt tennis và ván trượt tuyết. Đào tạo hệ thống trên COCO và gán đàn ông với phần cứng máy tính mạnh hơn các số liệu thống kê trong bức ảnh gốc.\r\n\r\nMột hệ thống machine learning cũng có thể tạo thêm thiên hướng sai lệch cho thông tin. Đào tạo một hệ thống machine learning với các frameworks phổ biến để làm đại diện cho các từ như vectơ thể hiện mối quan hệ giữa frameworks và hệ thống sẽ học hỏi những định kiến như ” đàn ông gắn với lập trình máy tính, phụ nữ gắn với nội trợ”, bác sĩ và y tá hoặc ông chủ để tiếp tân. Nếu bạn sử dụng hệ thống đó với một hệ thống dịch giữa các ngôn ngữ có các đại từ như “ he, she “, như trong tiếng Anh, với những đại từ chỉ giới tính trung lập, như trong tiếng Phần Lan hoặc tiếng Thổ Nhĩ Kỳ, ” Họ là bác sĩ ” trở thành ” Anh ấy là bác sĩ ” và ” Họ là y tá ” trở thành ” Cô ấy là y tá “.\r\n\r\nMachine learning có thể đưa ra những gợi ý tương tự trên các trang mua sắm khá tốt, nhưng một số vấn đề về thông tin nhạy cảm và feeback liên hồi có thể xảy ra; nếu bạn tham gia vào một nhóm Facebook không tán thành với việc tiêm ngừa, công cụ gợi ý của Facebook sẽ đưa ra gợi ý những nhóm khác liên quan đến lý thuyết conspiracy hoặc những nhóm tin rằng hình dạng của Trái đất là một mặt phẳng.\r\n\r\nBạn cần hiểu rõ những sai sót của machine learning. Nếu bạn không thể loại bỏ được chúng trong tập dữ liệu, hãy sử dụng các kĩ thuật như bình thường hoá các liên kết giới tính với các cặp từ để giảm sai sót hoặc bổ sung các mục không liên quan đến gợi ý để tránh “ filter bubble “.\r\n\r\n8. Machine learning chỉ sử dụng cho những mục đích tốt\r\nMachine learning cũng được dùng trong các tools chống virus, theo dõi nhất cử nhất động của những vụ tấn công mới để có thể phát hiện ra chúng nhanh nhất có thể khi vừa bùng phát. Tuy nhiên, các hacker đang sử dụng machine learning để nghiên cứu các công cụ phòng chống virus và phòng chống các cuộc tấn công lừa đảo với quy mô lớn bằng cách phân tích một lượng lớn public data hoặc phân tích các vụ lừa đảo thành công trước đó.\r\n\r\nTham khảo Tuyển dụng Machine Learning lương cao hấp dẫn cho bạn\r\n\r\n9. Machine learning sẽ dần thay thế con người\r\nKhá nhiều người lo sợ rằng AI sẽ chiếm dần nhiều công việc và chắc chắn nó sẽ thay thế dẫn những công việc do con người làm và cả cách thực hiện; hệ thống machine learning giúp cải thiện hiệu quả, quá trình diễn ra mượt mà và giảm chi phí. Về lâu về dài, nó sẽ tạo ra những ra những công việc mới cũng như làm một số công việc hiện tại trở nên lỗi thời.\r\n\r\nTuy nhiên, không phải công việc nào machine learning cũng có thể thực hiện được, vì độ phức tạp hoặc quy mô của công việc; Ví dụ, bạn không thể thuê đủ người để kiểm tra mọi bức hình được đăng trên social media để xem chúng có liên quan đến thương hiệu của bạn hay không.\r\n\r\nViệc machine learning đã bắt đầu tham gia vào là tạo ra những cơ hội kinh doanh mới, chẳng hạn như cải thiện trải nghiệm của khách hàng bằng predictive maintenance, và đưa ra những đề xuất và hỗ trợ cho các nhà lãnh đạo của doanh nghiệp. Giống như các thế hệ tự động hóa trước đó, machine learning có thể giúp nhân viên phát huy tối đa chuyên môn và sự sáng tạo của họ.', 2, 0, 8),
(17, '10 thuật toán hàng đầu dành cho lập trình viên', '10-thuat-toan-hang-dau-danh-cho-lap-trinh-vien', 'AI-Machine-Learning.jpg', 'Xã hội hiện tại đang chứng kiến một cuộc cách mạng to lớn trong lĩnh vực công nghệ. Những phát minh mới liên tục...', '2022-03-23 03:48:05', 1, '2022-03-23 03:48:05', 'Xã hội hiện tại đang chứng kiến một cuộc cách mạng to lớn trong lĩnh vực công nghệ. Những phát minh mới liên tục được cập nhật. Thường thì nguồn gốc của những phát minh này là từ những chương trình gạo cội có khả năng chi phối và thao túng các xu hướng công nghệ đang diễn ra. Trong số đó không thể không nói đến mã hóa và thuật toán, được sử dụng để phát triển các chương trình cạnh tranh như vậy.\r\n\r\nVì thế, đối với một chương trình thành công và có tầm ảnh hưởng, việc khai thác một thuật toán tốt nhất đúng và chính xác là điều tất yếu. Sau đây là 10 thuật toán hàng đầu được sử dụng rộng rãi trong lập trình và phát triển web.\r\n\r\nHashing\r\nHashing algorithms\r\nHiện đang tham gia vào việc phát hiện và xác định dữ liệu thích hợp bằng key và ID, theo một nghiên cứu, Hashing là thuật toán được sử dụng. Với vai trò mở rộng việc phát hiện lỗi, quản lý bộ nhớ cache, mật mã và tra cứu , hàm Hashing tích hợp các khóa phù hợp và cho các giá trị chính xác. Hàm này cũng có thể được sử dụng như một định danh duy nhất cho các tập dữ liệu nhất định và các phép tính toán cho phép người dùng tạo ra các giá trị dữ liệu không trùng lắp. Thông thường nó được áp dụng trong các bộ định tuyến để lưu trữ địa chỉ IP.\r\nSearch Algorithms\r\nUniform_binary_search\r\nThuật toán tìm kiếm thường được áp dụng cho dãy cấu trúc dữ liệu tuyến tính hoặc cấu trúc dữ liệu đồ họa. Thuật toán tìm kiếm tuyến tính còn được gọi là tìm kiếm nhị phân, giúp nhà phát triển tiến hành tìm kiếm hiệu quả trên các tập dữ liệu được sắp xếp với hàm phức tạp thời gian của O (log N). Cơ chế của tìm kiếm nhị phân là chia danh sách thành hai nửa cho đến khi nó tìm thấy mục được yêu cầu và thường được sử dụng để gỡ những lỗi liên quan đến git bisection. Các thuật toán này còn được biết đến với chức năng là Chiều sâu/Chiều rộng Tìm kiếm Đầu tiên, nó cho ta cấu trúc dữ liệu là một biểu đồ tròn hoặc hình cây đã bật chức năng tìm kiếm, xác định các tập dữ liệu cần thiết trong mô hình cây ngang. BFS rất phổ biến trong các công cụ tìm kiếm, cũng được sử dụng để xây dựng các bot trong AI hay định vị các con đường ngắn nhất giữa hai thành phố.\r\nThuật toán sắp xếp (Sort Algorithms)\r\nMergesort algorithms\r\nCác thuật toán sắp xếp thường được các nhà phát triển dùng để đặt dữ liệu theo cách có tổ chức. Trong thuật toán QuickSort, các thành phần dữ liệu được so sánh với nhau để xác định thứ tự tương ứng của chúng. Nó có độ phức tạp thời gian của O(nLogn) để thực hiện so sánh. Tuy nhiên, Radix Sort là một kỹ thuật nhanh hơn QuickSort vì nó sắp xếp các phần tử trong một mô hình tuyến tính với độ phức tạp thời gian O(n). Tính đơn giản của thuật toán này làm cho nó được ưa chuộng. Các thuật toán sắp xếp khác bao gồm Sắp xếp hợp nhất, Sắp xếp nhóm và Sắp xếp đếm.\r\nThuật toán lập trình động (Dynamic Programming Algorithms)\r\nExpected Value Dynamic Programming\r\nLập trình động thường là một hàm giải quyết vấn đề phức tạp liên quan đến trí tuệ bằng cách tách các vấn đề thành các bài toán con nhỏ hơn, giải quyết chúng sau đó xây dựng trở lại thành vấn đề phức tạp với bộ nhớ của các kết quả nhỏ hơn để đưa ra câu trả lời cho vấn đề phức tạp ban đầu. Lập trình động có khả năng tích hợp để ghi nhớ, cho phép lưu trữ các ký ức về các vấn đề đã giải quyết trước đó. Nếu lần tiếp theo vấn đề ấy lại xuất hiện thì nó sẽ được giải quyết nhanh hơn nhiều.\r\n\r\nPhân tích liên kết (Link Analysis)\r\nThường được sử dụng trong lĩnh vực mạng, phân tích liên kết cung cấp khả năng tương quan giữa các thực thể khác nhau trong một miền quan trọng đối với các công cụ tìm kiếm. Thuật toán sử dụng một biểu diễn đồ họa và ma trận phức tạp, liên kết các căn cứ tương tự trong các miền hiện tại. Phân tích liên kết phổ biến trong các công cụ tìm kiếm như Google, trong các trang truyền thông xã hội như Facebook, Twitter, nơi việc tìm kiếm mở rộng được chú trọng.\r\nPhép toán Mô-đun (Modulo Arithmetic Algorithms)\r\nNhiều thuật toán mã hóa phức tạp nhưng nếu được phân tích trên nền số học mô-đun thì trở nên đơn giản vô cùng. Trong số học mô-đun, các số chúng ta đang xử lý chỉ là các số nguyên và các phép toán được sử dụng là cộng, trừ, nhân và chia. Sự khác biệt duy nhất giữa số học mô-đun và số học trên sách vở là trong số học mô-đun, tất cả các hoạt động được thực hiện liên quan đến số nguyên dương, tức là mô đun.\r\nVí dụ:\r\n\r\nThuật toán Euclide cơ bản và mở rộng\r\nPhương trình hoàn hảo của Euler\r\nLũy thừa mô đun\r\nTính nghịch đảo theo mô đun\r\nĐịnh lý số dư của Trung Quốc\r\nĐịnh lý số dư của Trung Quốc và thực thi tính nghịch đảo của mô đun\r\nThuật toán xâu ký tự và phân tích cú pháp (String Matching and Parsing Algorithms)\r\nQuy trình tạo xâu tương ứng luôn quan trọng đặc biệt đối với miền và phần tử mạng. Thuật toán xâu ký tự này sẽ phát huy khả năng tối đa trong các tình huống mà các xâu phải khớp trong một chuỗi dài hoặc khi xác nhận chuỗi bằng cách phân tích cú pháp qua giới hạn được xác định trước. Các thuật toán này thường được sử dụng trong phát triển web cho URL.\r\nThuật toán biến đổi Fourier (Fourier Transform Algorithms)\r\nBiến đổi Fourier hay Biến đổi Fourire nhanh là những thuật toán đơn giản nhưng rất mạnh. Chúng được sử dụng để chuyển đổi tín hiệu từ miền thời gian sang miền tần số và ngược lại. Toàn bộ các mạng kỹ thuật số như Internet, WiFi, điện thoại, máy tính, bộ định tuyến, vệ tinh, sử dụng thuật toán này theo để vận hành. Đây là những thuật toán bắt buộc phải biết nếu bạn chuyên sâu về mảng điện tử, điện toán hoặc viễn thông.\r\nThuật toán các tập không giao nhau (Disjoint Sets)\r\nThuật toán các tập không giao nhau là cấu trúc dữ liệu đóng vai trò như các cấu trúc trợ giúp trong một thuật toán để biểu diễn nhiều tập hợp trong mảng riêng lẻ, với mỗi mục là một phần tử của một trong nhiều tập hợp. Do đó, các bộ tách rời đại diện cho các phần tử được kết nối trong các thuật toán đồ thị hay phân đoạn một hình ảnh.\r\nHệ số tích phân (Integer Factorization)\r\nThuật toán lũy thừa số nguyên là một thuật toán toán cung cấp hướng dẫn từng bước về cách lấy các thừa số nguyên tố của một số tổng hợp. Thuật toán này giải quyết các vấn đề phức tạp trong các nền tảng mã hóa yêu cầu bạn phải giải quyết các số nguyên phức hợp lớn.', 2, 0, 8),
(18, 'AI đi vào thực tiễn (Phần 1): Những biến động của năm 2018', 'ai-di-vao-thuc-tien-phan-1-nhung-bien-dong-cua-nam-2018', 'AI2018.jpeg', 'Năm 2018 có thể coi là một dấu mốc lớn trong lĩnh vực trí tuệ nhân tạo (AI), dù có cả những nốt thăng...', '2022-03-23 05:14:06', 1, '2022-03-23 05:14:06', 'Xe tự động: Bất kể những diễn biến không mấy lạc quan, rõ ràng năm 2018 là một năm quan trọng trong việc thúc đẩy ngành công nghiệp sản xuất xe tự vận hành đi lên. Hàng loạt cuộc thử nghiệm được tiến hành của Uber, Waymo (của Google), Lyft cùng nhiều công ty khác được diễn ra và đã có những thành quả đầu tiên sau giai đoạn kiện tụng về quyền sở hữu trí tuệ giữa các ông lớn. Có thể nói xe tự lái đã chính thức có mặt dù vẫn còn nhiều vấn đề phải giải quyết trước khi các phương tiện có khả năng tự chủ hoàn toàn.\r\nTrợ lý ảo, ứng dụng tại các doanh nghiệp: Các thiết bị tích hợp trợ lý “ảo” và được điều hành thông qua giọng nói đã được đầu tư về hình ảnh, tính năng một cách đáng kể và có một vị trí lớn trong xu hướng AI trong năm 2018. Các trợ lý ảo có thể gọi điện, trò chuyện với người thật hoàn hảo tới mức không thể hình dung là họ đang nói chuyện với máy. Chatbot trở nên phổ biến tại lĩnh vực dịch vụ chăm sóc khách hàng, trong khi những công nghệ tự quản lý thông tin tích hợp AI đã dần hoàn thiện hơn. Nhiều công ty cũng đang nỗ lực đưa ra những bước tiến mới trong quá trình xử lý ngôn ngữ tự nhiên, giúp doanh nghiệp có thể tìm hiểu rõ hơn các luồng dữ liệu phi cấu trúc của họ. Hoạt động marketing có sử dụng hỗ trợ từ AI cũng là một trong những xu hướng nổi bật trong năm 2018, với khái niệm siêu cá nhân hóa được chú ý hơn khi các công ty nhận ra lợi ích của AI trong hoạt động này.\r\nChương trình AI cấp quốc gia: Rất nhiều nước trên thế giới đều đẩy mạnh và xem việc phát triển AI là một trong những nhiệm vụ hàng đầu. Điển hình như lộ trình ba bước của Trung Quốc với nguồn quỹ đầu tư 5 tỷ USD cùng một công viên công nghệ trị giá 2,1 tỷ USD để tạo điều kiện phát triển công nghệ, Mỹ và Pháp với kế hoạch đầu tư lần lượt là 2 tỷ USD và 1,5 tỷ Euro cho các sáng kiến liên quan đến AI, …\r\nRiêng ở Việt Nam, “Kế hoạch phát triển trí tuệ nhân tạo ở Việt Nam đến năm 2025” đã được ban hành và sẽ tập trung phát triển các công nghệ nền tảng về xử lý và nhận dạng âm thanh, tiếng nói, hình ảnh, thị giác máy, tích hợp dữ liệu, bản đồ số, quản lý dây chuyền sản xuất. Nhiều trường đại học cũng đã bổ sung và cập nhật các kiến thức liên quan đến AI vào chương trình đào tạo cũng như một số trường đào tạo miễn phí ngành Robot và Trí tuệ nhân tạo cho sinh viên.\r\n\r\nBên cạnh đó, các mảng khác của trí tuệ nhân tạo cũng thu được những kết quả rất tích cực: nhận diện khuôn mặt ngày càng phát triển giúp tăng cường khả năng bảo mật và quản lý, quá trình tự động hóa robot (RPA) và học máy ngày càng được đẩy mạnh, các nguồn vốn được rót vào cũng như bộ luật AI được ban hành giúp cho AI ngày càng lan rộng và phát triển mạnh mẽ hơn.\r\n\r\nAI một trong những công nghệ đang xâm nhập vào thực tiễn, góp phần định hướng tương lai đang tạo ra nhiều cơ hội cho các doanh nghiệp trong thời kỳ chuyển đổi số. Nhưng để đi đến những điều lớn lao, AI là gì và đang được ứng dụng xung quanh chúng ta như thế nào? bạn nên nắm rõ. Một trong những tech-meetup đáng chú ý vào tháng 03/2019 là “AI và NLP – Ứng dụng thực tiễn và cách bắt đầu”', 2, 0, 8),
(19, 'Tổng hợp Cheat Sheets cho AI, Neural Networks, Machine Learn', 'tong-hop-cheat-sheets-cho-ai-neural-networks-machine-learning-deep-learning-va-big-data', 'AI-Machine-Learning.jpg', 'Tác giả: Stefan Kojouharov Trong vài tháng qua, tôi đã bắt đầu sưu tập Cheat Sheet AI. Đôi khi tôi chia sẻ chúng với bạn...', '2022-03-23 05:22:25', 1, '2022-03-23 05:22:25', 'Trong vài tháng qua, tôi đã bắt đầu sưu tập Cheat Sheet AI. Đôi khi tôi chia sẻ chúng với bạn bè và đồng nghiệp và gần đây tôi đã được hỏi rất nhiều, vì vậy tôi quyết định chia sẻ toàn bộ chúng cho cộng đồng. Để làm cho mọi thứ trở nên thú vị hơn và dẽ hiểu hơn, tôi đã thêm các mô tả và /hoặc trích đoạn cho mỗi chủ đề chính.\r\nNeural Networks\r\nNeural Networks Graphs\r\nMachine Learning Overview\r\nMachine Learning: thuật toán Scikit-learn\r\nMachine learning cheat sheet sẽ giúp bạn tìm được các estimatorphù hợp cho công việc, đó là phần khó nhất. Flowchart sẽ giúp bạn kiểm tra tài liệu và hướng dẫn sơ bộ của từng estimator sẽ giúp bạn biết thêm về các vấn đề và cách giải quyết nó.\r\n\r\nScikit-Learn\r\nScikit-learn (trước đây là scikits.learn) là một thư viện Machine learning miễn phí dành cho ngôn ngữ lập trình Python. Nó có các thuật toán phân loại, hồi quy và phân cụm khác nhau bao gồm các vector machine hỗ trợ, random forests, gradient boosting, k-means và DBSCAN được thiết kế để tương tác với Python và thư viện khoa học NumPy và SciPy.\r\n\r\nMachine learning: Cheat sheet thuật toán\r\nCheat sheet machine learning này từ Microsoft Azure sẽ giúp bạn chọn các thuật toán machine learning thích hợp cho giải pháp phân tích tiên đoán của bạn. Thứ nhất, cheat sheet sẽ hỏi bạn về tính chất dữ liệu và sau đó đề xuất các thuật toán tốt nhất cho công việc của bạn.\r\n\r\nPython for Data Science\r\nTensorFlow\r\nGoogle đã công bố thế hệ thứ hai của TPU, cũng như TPU sẵn có trong Google Compute Engine. [12] Các TPU thế hệ thứ hai cung cấp đến 180 teraflop hiệu suất, và khi được tổ chức thành các nhóm 64 TPUs cung cấp lên đến 11,5 petaflops.\r\n\r\nKeras\r\nNăm 2017, nhóm TensorFlow của Google đã quyết định hỗ trợ Keras thư viện lõi của TensorFlow. Chollet giải thích rằng Keras là một interface hơn là end-to-end machine-learning framework. Nó trình bày một tập các phép tính trừu tượng cấp cao, trực quan hơn giúp dễ dàng cấu hình neural networks bất kể thư viện backend.\r\n\r\nNumpy\r\nNumPy nhắm mục tiêu thực hiện tham chiếu CPython của Python, đó là một giao diện non-optimizing bytecode. Các thuật toán được viết cho phiên bản này của Python thường chạy chậm hơn nhiều so với các trình biên dịch tương đương. NumPy giải quyết vấn đề xử lý chậm bằng cách cung cấp mảng đa chiều, các hàm và toán tử hoạt động hiệu quả trên các mảng, đòi hỏi phải viết lại một số code, chủ yếu là inner loops sử dụng NumPy.\r\n\r\nPandas\r\nTên ‘Pandas’ bắt nguồn từ thuật ngữ ““panel data “, đây là thuật ngữ dùng cho bộ dữ liệu có cấu trúc đa chiều.\r\n\r\nData Wrongling\r\nThuật ngữ “data wrangler ” bắt đầu từ nền văn hoá nhạc pop. Trong bộ phim Kong 2017: Skull Island, nhân vật được đóng bởi nam diễn viên Marc Evan Jackson được giới thiệu là “Steve Woodward, người viết dữ liệu của chúng tôi”.\r\n\r\nData Wrangling với dplyr và tidyr\r\nScipy\r\nSciPy được xây dựng trên đối tượng mảng NumPy và là một phần của stack NumPy bao gồm các công cụ như Matplotlib, pandas và SymPy, và một tập hợp các scientific computing libraries mở rộng. Stack NumPy này có những người dùng tương tự với các ứng dụng khác như MATLAB, GNU Octave, và Scilab. Stack NumPy cũng đôi khi được gọi là stack SciPy. [3]\r\n\r\nMatplotlib\r\nMatplotlib là một thư viện cho ngôn ngữ lập trình Python và các phép toán mở rộng của NumPy. Nó cung cấp một API hướng đối tượng để nhúng các mảnh vào các ứng dụng sử dụng các bộ dụng cụ GUI chung như Tkinter, wxPython, Qt, hoặc GTK +. Ngoài ra còn có một thủ tục gọi lf “pylab” interface dựa trên tuyên bố machine (như OpenGL), được thiết kế để gần giống như của MATLAB, mặc dù việc sử dụng nó là nản lòng SciPy sử dụng matplotlib.\r\n\r\nPyplot là một mô-đun matplotlib cung cấp một interface giống như MATLAB. [6] Matplotlib được thiết kế để có thể sử dụng được như MATLAB, với khả năng sử dụng Python, với lợi thế là nó miễn phí.\r\n\r\nData Visualization\r\nPySpark\r\nBig-O', 3, 0, 8),
(20, 'Thử sức học Machine Learning trong vòng 1 tuần', 'hoc-machine-learning', 'AI-Machine-Learning.jpg', 'Học Machine learning (ML)!!! nghe có vẻ là nhiệm vụ bất khả thi, đặc biệt là khi bạn học sai cách. Tuy nhiên, sau khi...', '2022-03-23 05:24:11', 1, '2022-03-23 05:24:11', 'Học Machine learning (ML)!!! nghe có vẻ là nhiệm vụ bất khả thi, đặc biệt là khi bạn học sai cách.\r\n\r\nTuy nhiên, sau khi dành trọn 1 tuần để học những thức căn bản của ML, mình nhận thấy nó dễ tiếp cận hơn nhiều so với những gì mình tưởng tượng.\r\n\r\nTrong bài viết này mình sẽ giới thiệu các bạn một lộ trình bắt đầu học ML như thế nào từ những kinh nghiệm thực tế trong tuần đầu mình học.\r\n\r\nBackground cần có\r\nTrước khi mình học ML, mình đã đọc trước về nó một chút, và có tham gia một nửa khoá học của Andrew Ng trên Coursera và một vài khoá học lý thuyết khác. Nhờ vậy mà mình có được một ít kiến thức về ML, nhưng mình vẫn không thể dùng mớ kiến thức đó để viết code, cũng như ứng dụng thực tiễn. Và mình muốn thay đổi việc này.\r\n\r\nMình muốn có khả năng giải quyết vấn đề với ML vào cuối tuần học đó, mặc cho việc bỏ qua rất nhiều nguyên tắc cơ bản, và phải tiếp cận theo hướng từ trên xuống dưới, thay vì từ dưới đi lên.\r\n\r\nSau khi tham khảo trên Hacker News, mình đi đến kết luận rằng module Scikit Learn của Python là điểm xuất phát tuyệt vời nhất. Module này cung cấp cho bạn rất nhiều thuật toán machine learning để lựa chọn, đưa việc học máy thực tế xuống chỉ còn một vài dòng code.\r\n\r\nNgày Thứ 2: Học một số thứ thực tế\r\nMình bắt đầu tuần học bằng cách tìm kiếm video tutorial về Scikit Learn. Cuối cùng mình cũng tìm được tutotial của Sentdex về cách sử dụng ML để đầu tư cổ phiếu, tutorial này cung cấp cho mình một số kiến thức cấn thiết để chuyển sang bước tiếp theo.\r\n\r\nThử sức học Machine Learning trong vòng 1 tuần\r\nƯu điểm của tutorial của Sentdex là người hướng dẫn giới thiệu bạn toàn bộ các bước thu thập data. Khi bạn xem hết, bạn sẽ nhận ra việc tìm nạp và dọn dẹp data có thể tốn nhiều thời gian hơn cả việc học máy thực sự. Vậy nên kỹ năng viết script để scrape data từ các file hoặc crawl trên web là những kỹ năng cần thiết cho những người đam mê ML.\r\n\r\nMình cũng phải xem lại một số video mỗi khi gặp vấn đề, và mình nghĩ các bạn cũng nên như thế.\r\n\r\nTuy nhiên, nếu bạn đã biết cách scrape data từ website, tutorial này có lẽ sẽ không phù hợp với bạn vì có nhiều video cũng nói về tìm nạp dữ liệu rồi. Trong trường hợp đó, Intro to Machine Learning của Udacity sẽ là nơi xuất phát tốt nhất dành cho bạn.\r\n\r\nNgày thứ 3: thử giải quyết vấn đề thực tế\r\nVào ngày thứ 3, mình muốn thử xem là mình đã có thể sử dụng những kiến thức vừa học để giải quyết một vấn đề thực tế chưa. Có 1 lập trình viên khác trong team code của mình đang tham gia cuộc thi data visualization của Ngân hàng Anh, mình cùng anh ta kiểm tra bộ dữ liệu mà ngân hàng công bố. Data thú vị nhất chính là các khảo sát hộ gia đình của họ. Đây là một khảo sát hàng năm mà ngân hàng thực hiện trên một vài nghìn hộ gia đình có liên quan đến tiền.\r\n\r\nVấn đề mà chúng mình phải giải quyết là: “Với thông tin về trình độ học vấn, tuổi tác và thu nhập của một người, máy tính có thể dự đoán được giới tính của người đó không?”\r\n\r\nMình lượn một vòng quanh bộ dữ liệu, dành một vài giờ clean data, và sử dụng Scikit Learn map để tìm thuật toán phù hợp cho vấn đề trên.\r\n\r\nThử sức học Machine Learning trong vòng 1 tuần\r\nCuối cùng bọn mình có được tỉ lệ thành công là 63%, cũng không ấn tượng là mấy. Nhưng ít nhất thì máy tính cũng đã có thể dự đoán tốt hơn một chút so với tỉ lệ 50% của việc tung đồng xu.\r\n\r\nXem kết quả giống như tự tạo động lực cho bản thân, nên mình khuyên các bạn hãy tự làm giống mình khi đã biết sơ cách sử dụng Scikit Learn nhé.\r\n\r\nVà đó cũng là khoảnh khắc bạn nhận ra bạn có thể sử dụng ML để giải quyết các vấn đề thực tế trong cuộc sống.\r\n\r\nNgày thứ 4: Học lên tiếp\r\nSau khi mần đủ các module Scikit Learn, mình quyết định thử viết một thuật toán hồi quy tuyến tính mặc dù chưa biết gì. Mình muốn làm điều này bởi vì mình cảm thấy là mình không thể thực sự hiểu được nếu không thực hành.\r\n\r\nMay mắn là vào thời điểm này mình tìm đươc khoá học Coursera có dạy chi tiết về cách một vài thuật toán làm việc. Cụ thể hơn, nó mô tả khái niệm cơ bản về việc sử dụng linear regression với gradient descent\r\n\r\nThử sức học Machine Learning trong vòng 1 tuần\r\nĐây hoàn toàn là kỹ thuật hiệu quả nhất, vì nó giúp bạn hiểu được các bước từ đầu đến cuối. Mình cực kì khuyến khích các bạn nên làm thử.\r\n\r\nMình dự định viết lại cách triển khai của mình đối với các thuật toán phức tạp hơn khi mình thực hành, nhưng mình thích làm việc này sau khi mình đã “ngâm” hết các thuật toán tương ứng trong Scikit Learn hơn.\r\n\r\nNgày thứ 5: Đi thi thố\r\nVào ngày thứ 5, mình bắt đầu làm bài hướng dẫn giới thiệu của Kaggle. Kaggle là một platform dành cho các cuộc thi ML, nơi bạn có thể gửi các giải pháp cho các vấn đề mà công ty hay tổ chức nào đó đưa lên.\r\n\r\nMình khuyên bạn nên thử Kaggle sau khi có một ít thuật toán và kiến thức thực tế về Machine Learning để bắt đầu với nó. Nếu không thì lại chuyển từ có ích sang bực bội mà thôi.\r\n\r\nThử sức học Machine Learning trong vòng 1 tuần\r\nTutorial của Bag of Words hướng dẫn bạn từng bước tham gia bài dự thi, và cung cấp cho bạn một bản giới thiệu ngắn gọn và thú bị về Natural Language Processing (NLP). Mình thấy hứng thú với NLP hơn nhiều khi coi xong tutorial này.\r\n\r\nNgày thứ 6: Trở lại trường\r\nMình tiếp tục làm việc với những tutorial của Kaggle vào ngày thứ 6, và cũng bắt đầu dùng Intro to Machine Learning của Udacity. Mình đã đi được nửa chặng đường và mọi thứ khá thú vị.\r\n\r\nThử sức học Machine Learning trong vòng 1 tuần\r\nNó dễ hơn khoá học Coursera nhiều, vì nó không đào sâu vào các thuật toán. Nó cũng thực tế hơn, vì nó dạy Scikit Learn giúp việc áp dụng vào thực tế dễ hơn nhiều so với viết thuật toán trong Octave khi bạn học Coursera.\r\n\r\nXem thêm những nguồn nghiên cứu Machine Learning tốt nhất cho người mới bắt đầu.\r\n\r\nCòn một chặng đường phía trước\r\n1 tuần vừa rồi rất vui với mình, mình nhận thấy được sự hữu ích của ML trong xã hội. Càng tìm hiểu, mình càng thấy nó có thể sử dụng để giải quyết mọi vấn đề.\r\n\r\nNếu bạn hứng thú với machine learning, mình mạnh dạng khuyên bạn nên dành một vài ngày hoặc vài buổi tối để đắm chìm với nó.\r\n\r\nChọn cách tiếp cận từ trên xuống nếu bạn không sẵn sàng học nhiều thứ nặng nề và muốn giải quyết các vấn đề nhanh nhất có thể.\r\n\r\nChúc bạn may mắn!', 3, 0, 8);
INSERT INTO `post` (`post_id`, `post_title`, `slug`, `thumbnail`, `summary`, `updatedAt`, `published`, `publishedAt`, `content`, `user_id`, `viewcount`, `category_id`) VALUES
(21, 'Big Data là gì? Tất tần tật về Big Data', 'big-data', 'AI-Machine-Learning.jpg', 'Phân tích nhiều dữ liệu chỉ là một phần của việc khiến phân tích big data khác với việc phân tích dữ liệu trước...', '2022-03-23 05:25:58', 1, '2022-03-23 05:25:58', 'Phân tích nhiều dữ liệu chỉ là một phần của việc khiến phân tích big data khác với việc phân tích dữ liệu trước đây. Hãy cùng tìm hiểu các khía cạnh khác.\r\n\r\nCó data, và sau đó có big data. Vậy, sự khác biệt là gì?\r\n\r\nBig Data là gì?\r\nBig Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ lớn đến mức các phần mềm xử lý dữ liệu truyền thống không có khả năng thu thập, quản lý và xử lý dữ liệu trong một khoảng thời gian hợp lý.\r\n\r\nCác ứng dụng đang sử dụng Big data\r\nBig data và phân tích có thể được áp dụng trong nhiều vấn đề kinh doanh và nhiều trường hợp sử dụng khác nhau. Dữ liệu lớn (Big Data) trên thực tế đang được ứng dụng vào rất nhiều lĩnh vực của nền kinh tế, tạo những chuyển biến ấn tượng, giúp tăng hiệu quả và năng suất của doanh nghiệp.\r\n\r\n1. Ngành Ngân hàng\r\n\r\nTrong hệ thống ngân hàng, Big Data đã và đang được ứng dụng hiệu quả thể hiện vai trò quan trọng của mình trong mọi hoạt động của ngân hàng: từ thu tiền mặt đến quản lý tài chính.\r\n\r\nNgân hàng ứng dụng Big Data như thế nào:\r\n\r\nSử dụng các kỹ thuật phân cụm giúp đưa ra quyết định quan trọng. Hệ thống phân tích có thể xác định các địa điểm chi nhánh nơi tập trung nhiều nhu cầu của khách hàng tiềm năng, để đề xuất lập chi nhánh mới.\r\nKết hợp nhiều quy tắc được áp dụng trong các lĩnh vực ngân hàng để dự đoán lượng tiền mặt cần thiết sẵn sàng cung ứng ở một chi nhánh tại thời điểm cụ thể hàng năm.\r\nKhoa học dữ liệu hiện đang là nền tảng của hệ thống ngân hàng kĩ thuật số.\r\nMachine learning và AI đang được nhiều ngân hàng sử dụng để phát hiện các hoạt động gian lận và báo cáo cho các chuyên viên liên quan.\r\nKhoa học dữ liệu hỗ trợ xử lý, lưu trữ và phân tích lượng dữ liệu khổng lồ từ các hoạt động hàng ngày và giúp đảm bảo an ninh cho ngân hàng.\r\nCác ngân hàng nổi bật: tuyển dụng ACB, VP Bank tuyển dụng, MSB tuyển dụng\r\n\r\n2. Ngành y tế\r\n\r\nKhoa học dữ liệu đang dần khẳng định vai trò khá quan trọng trong việc cải thiện sức khỏe con người ngày nay. Big Data không chỉ được ứng dụng để xác định phương hướng điều trị mà giúp cải thiện quá trình chăm sóc sức khỏe.\r\n\r\nNgành y tế ứng dụng Big Data:\r\n\r\nCho phép người quản lý ca dự đoán các bác sĩ cần thiết vào những thời điểm cụ thể\r\nTheo dõi tình trạng bệnh nhân bằng để theo dõi hồ sơ sức khỏe điện tử.\r\nSử dụng các thiết bị kỹ thuật số có thể đeo, hệ thống Big Data có thể theo dõi bệnh nhân và gửi báo cáo cho các bác sĩ liên quan.\r\nBig Data có thể đánh giá các triệu chứng và xác định nhiều bệnh ở giai đoạn đầu.\r\nCó thể lưu giữ các hồ sơ nhạy cảm được bảo mật và lưu trữ lượng dữ liệu khổng lồ một cách hiệu quả.\r\nCác ứng dụng Big Data cũng có thể báo trước khu vực có nguy cơ bùng phát dịch như: sốt xuất huyết hoặc sốt rét.\r\n3. Thương mại điện tử\r\n\r\nThương mại điện tử không chỉ tận hưởng những lợi ích của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ. Big Data có thể tạo lợi thế cạnh tranh cho doanh nghiệp bằng cách cung cấp thông tin chuyên sâu và các bản báo cáo phân tích xu hướng tiêu dùng.\r\n\r\nThương mại điện tử ứng dụng Big Data:\r\n\r\nCó thể thu thập dữ liệu và yêu cầu của khách hàng ngay cả trước khi khách thực sự bắt đầu giao dịch.\r\nTạo ra một mô hình tiếp thị hiệu suất cao.\r\nNhà quản lý trang thương mại điện tử có thể xác định các sản phẩm được xem nhiều nhất và tối ưu thời gian hiển thị của các trang sản phẩm này.\r\nĐánh giá hành vi của khách hàng và đề xuất các sản phẩm tương tự. Điều này làm tăng khả năng bán hàng, từ đó tạo ra doanh thu cao hơn.\r\nNếu bất kỳ sản phẩm nào được thêm vào giỏ hàng nhưng cuối cùng không được khách hàng mua, Big Data có thể tự động gửi code khuyến mại cho khách hàng cụ thể đó.\r\nCác ứng dụng Big Data còn có thể tạo một báo cáo tùy chỉnh theo các tiêu chí: độ tuổi, giới tính, địa điểm của khách truy cập, v.v.\r\nXác định các yêu cầu của khách hàng, những gì họ muốn và tập trung vào việc cung cấp dịch vụ tốt nhất để thực hiện nhu cầu của họ.\r\nPhân tích hành vi, sự quan tâm của khách hàng và theo xu hướng của họ để tạo ra các sản phẩm hướng đến khách hàng.\r\nCung cấp các sản phẩm tốt hơn với chi phí thấp hơn.\r\nCó thể thu thập nhiều dữ liệu về hành vi khách hàng để thiết kế mô hình tiếp thị tối ưu dành được tùy biến theo đối tượng hoặc nhóm đối tượng, tăng khả năng bán hàng.\r\nTìm ra sự tương đồng giữa khách hàng và nhu cầu của họ. Từ đó, việc nhắm mục tiêu các chiến dịch quảng cáo có thể được tiến hành dễ dàng hơn dựa trên những phân tích đã có trước đó.\r\nCông ty thương mại điện từ nổi bật: fpt shop tuyển dụng it, juno tuyển dụng,….\r\n\r\n4. Ngành bán lẻ\r\nBig Data mang lại cơ hội cho lĩnh vực bán lẻ bằng cách phân tích thị trường cạnh tranh và sự quan tâm của khách hàng. Nó giúp xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng bằng cách thu thập dữ liệu đa dạng. Từ những dữ liệu thu thập được có thể cải thiện hiệu suất và hiệu quả bán hàng.\r\n\r\nNgành bán lẻ ứng dụng Big Data:\r\n\r\nBig data giúp nhà quản lý xây dựng mô hình chi tiêu của từng khách hàng.\r\nVới sự trợ giúp của các phân tích dự đoán, ngành công nghiệp có thể so sánh tỷ lệ cung – cầu và có thể tránh tiếp tục tung ra thị trường các sản phẩm không được hầu hết khách hàng đón nhận.\r\nNgành bán lẻ có thể xác định vị trí bố trí sản phẩm trên kệ hàng tùy thuộc vào thói quen mua hàng và nhu cầu của khách hàng và đưa ra các chiến lược kinh doanh mới để cải thiện.\r\nKết hợp phân tích cùng lúc các dữ liệu về thời điểm, dữ liệu giao dịch, dữ liệu truyền thông xã hội, dự báo thời tiết để xác định chính xác nhất sản phẩm phù hợp để luôn sẵn sàng cung ứng cho khách hàng.\r\n5. Digital Marketing\r\n\r\nDigital Marketing là chìa khóa để cánh cửa thành công cho bất kỳ doanh nghiệp nào. Giờ đây, không chỉ các công ty lớn có thể điều hành các hoạt động quảng cáo tiếp thị mà cả các doanh nhân nhỏ cũng có thể chạy các chiến dịch quảng cáo thành công trên các nền tảng truyền thông xã hội và quảng bá sản phẩm của họ. Big Data đã tiếp sức cho Digital Marketing phát triển thực sự mạnh mẽ, và nó đã trở thành một phần không thể thiếu của bất kỳ doanh nghiệp nào.\r\n\r\nDigital Marketing ứng dụng Big Data:\r\n\r\nPhân tích thị trường, đối thủ cạnh tranh và đánh giá mục tiêu kinh doanh. Điều này giúp cho doanh nghiệp xác định rõ hơn, đâu là cơ hội tốt để tiếp tục tiến hành các kế hoạch kinh doanh tiếp theo.\r\nCó thể xác định người dùng trên các phương tiện truyền thông xã hội và nhắm mục tiêu cho họ dựa trên nhân khẩu học, giới tính, thu nhập, tuổi tác và sở thích.\r\nTạo báo cáo sau mỗi chiến dịch quảng cáo bao gồm hiệu suất, sự tham gia của khán giả và những gì có thể được thực hiện để tạo kết quả tốt hơn.\r\nKhoa học dữ liệu được sử dụng cho các khách hàng nhắm mục tiêu và nuôi dưỡng chu trình khách hàng.\r\nTập trung vào các chủ đề được tìm kiếm cao và tư vấn cho các chủ doanh nghiệp thực hiện chúng trên chiến lược nội dung để xếp hạng trang web doanh nghiệp trên cao hơn trên google (SEO).\r\nCó thể tạo đối tượng tương tự bằng cách sử dụng cơ sở dữ liệu đối tượng hiện có để nhắm mục tiêu các khách hàng tương tự và kiếm được lợi nhuận.\r\n\r\n6. Ngăn chặn nội dung đen\r\nVí dụ cụ thể như là Extension (Chrome, Firefox, Safari…) Có nhiều addon phục vụ cho việc content filtering miễn phí sử dụng Bigdata để thu thập và dự đoán xem nội dung đó có phù hợp không. Ví dụ chức năng Ad Block nhanh chóng block các banner, pop ups, video ads gây phiền nhiễu một lần và mãi mãi. Sau đó nó lập tức thu thập và gửi về server blacklist những yếu tố này. Data càng nhiều thì tỷ lệ nhận diện và block ngày càng chính xác.\r\n\r\nĐặc trưng của Big Data\r\nBig data thường đặc trưng với ba V:\r\n\r\nVolume: Khối lượng dữ liệu\r\nVariety: Nhiều loại dữ liệu đa dạng\r\nVelocity: Vận tốc mà dữ liệu cần phải được xử lý và phân tích\r\n\r\nKhái niệm big data đi kèm với các thành phần có liên quan cho phép các tổ chức đưa dữ liệu vào sử dụng thực tế và giải quyết một số vấn đề kinh doanh. Bao gồm:\r\n\r\nCơ sở hạ tầng IT cần thiết để hỗ trợ big data.\r\nCác phân tích áp dụng với dữ liệu.\r\nCông nghệ cần thiết cho các dự án big data các bộ kĩ năng liên quan.\r\nVà các trường hợp thực tế có ý nghĩa đối với big data.\r\nBig data và analytics\r\nĐiều thực sự mang lại giá trị từ các tổ chức dữ liệu lớn là phân tích dữ liệu. Nếu không có phân tích, nó chỉ là một tập dữ liệu với việc sử dụng hạn chế trong kinh doanh.\r\n\r\nBằng cách phân tích dữ liệu lớn, các công ty có thể có những lợi ích như tăng doanh thu, dịch vụ khách hàng được cải thiện, hiệu quả cao hơn và tăng khả năng cạnh tranh.\r\n\r\nPhân tích dữ liệu liên quan đến việc kiểm tra bộ dữ liệu để thu thập thông tin chi tiết hoặc rút ra kết luận về những gì chúng chứa, chẳng hạn như các xu hướng và dự đoán về hoạt động trong tương lai.\r\n\r\nBằng cách phân tích dữ liệu, các tổ chức có thể đưa ra các quyết định kinh doanh tốt hơn như khi nào và ở đâu nên chạy chiến dịch tiếp thị hoặc giới thiệu một sản phẩm hoặc dịch vụ mới.\r\n\r\nSự phân tích có thể tham khảo các ứng dụng kinh doanh thông minh hay tiên tiến hơn. Phép phân tích dự đoán như ứng dụng được các tổ chức khoa học sử dụng.\r\n\r\nLoại phân tích dữ liệu cao cấp nhất là data mining, nơi các nhà phân tích đánh giá các bộ dữ liệu lớn để xác định mối quan hệ, mô hình và xu hướng.\r\n\r\nPhân tích dữ liệu có thể bao gồm phân tích dữ liệu thăm dò ( để xác định các mẫu và mối quan hệ trong dữ liệu) và phân tích dữ liệu xác nhận ( áp dụng các kĩ thuật thống kê để tìm ra giả thiết về một bộ dữ liệu có đúng hay không).\r\n\r\nMột mảng khác là phân tích dữ liệu định lượng ( hoặc phân tích dữ liệu số có các biến có thể so sánh theo thống kê) so với phân tích dữ liệu định tính ( tập trung vào các dữ liệu không phải là dữ liệu cá nhân như video, hình ảnh và văn bản).\r\n\r\nCơ sở hạ tầng IT để hỗ trợ big data\r\nĐối với khái niệm big data để làm việc, các tổ chức cần phải có cơ sở hạ tầng để thu thập và chứa dữ liệu, cung cấp quyền truy cập và đảm bảo thông tin trong khi lưu trữ và chuyển tiếp.\r\n\r\nỞ cấp độ cao, bao gồm hệ thống lưu trữ và máy chủ được thiết kế cho big data, phần mềm quản lý và tích hợp dữ liệu, thông tin kinh doanh và phần mềm phân tích dữ liệu, và các ứng dụng big data.\r\n\r\nPhần lớn các cơ sở hạ tầng này sẽ tập trung một chỗ, vì các công ty muốn tiếp tục tận dụng các khoản đầu tư vào trung tâm dữ liệu của mình. Nhưng ngày càng có nhiều tổ chức dựa vào các dịch vụ điện toán đám mây để xử lý nhiều yêu cầu big data của họ.\r\n\r\nThu thập dữ liệu đòi hỏi phải có nguồn. Rất nhiều trong số những ứng dụng sau đây, như các ứng dụng web, các kênh truyền thông xã hội, ứng dụng di động và lưu trữ email đã được cài sẵn.\r\n\r\nNhưng khi IoT trở nên phổ biến hơn, các công ty có thể cần phải triển khai cảm biến trên tất cả các loại thiết bị, phương tiện và sản phẩm để thu thập dữ liệu, cũng như các ứng dụng mới tạo ra dữ liệu người dùng. Phân tích dữ liệu theo định hướng IoT có các kỹ thuật và công cụ chuyên biệt của nó.\r\n\r\nĐể lưu trữ tất cả các dữ liệu đến, các tổ chức cần phải có đủ dung lượng lưu trữ tại chỗ. Các tùy chọn lưu trữ bao gồm kho dữ liệu truyền thống, data lakes và lưu trữ trên đám mây.\r\n\r\nCác công cụ cơ sở hạ tầng bảo mật có thể bao gồm việc mã hóa dữ liệu, xác thực người dùng và các điều khiển truy cập khác, hệ thống giám sát, tường lửa, quản lý di động của doanh nghiệp và các sản phẩm khác để bảo vệ hệ thống và dữ liệu.\r\n\r\nCác công nghệ đặc biệt dành cho Big data\r\nNgoài cơ sở hạ tầng IT được sử dụng cho dữ liệu nói chung, có một số công nghệ cụ thể dành cho big data mà cơ sở hạ tầng IT của bạn nên hỗ trợ.\r\n\r\nHệ sinh thái Hadoop\r\nHadoop là một trong những công nghệ liên quan chặt chẽ nhất với big data. Dự án Apache Hadoop phát triển phần mềm mã nguồn mở cho máy tính có khả năng mở rộng và phân tán.\r\n\r\nThư viện phần mềm Hadoop là một khuôn mẫu cho phép xử lý phân tán các bộ dữ liệu lớn trên các nhóm máy tính sử dụng các mô hình lập trình đơn giản. Nó được thiết kế để mở rộng từ một máy chủ duy nhất sang hàng ngàn máy khác, mỗi máy cung cấp tính toán và lưu trữ cục bộ.\r\n\r\nDự án bao gồm rất nhiều phần:\r\n\r\nHadoop Common, các tiện ích phổ biến hỗ trợ các phần Hadoop khác\r\nHadoop Distributed File System, cung cấp khả năng truy cập dữ liệu ứng dụng cao\r\nHadoop YARN, một khuôn mẫu cho kế hoạch làm việc và quản lý tài nguyên cụm\r\nHadoop MapReduce, một hệ thống dựa trên YARN để xử lý song song bộ dữ liệu lớn.\r\nApache Spark\r\nMột phần của hệ sinh thái Hadoop, Apache Spark là một khuôn mẫu tính toán cụm nguồn mở được sử dụng làm công cụ xử lý big data trong Hadoop.\r\n\r\nSpark đã trở thành một trong những khuôn mẫu xử lý big data quan trọng, và có thể được triển khai theo nhiều cách khác nhau. Nó cung cấp các phương thức hỗ trợ đối với Java, Scala, Python (đặc biệt là Anaconda Python distro ), và ngôn ngữ lập trình R ( R đặc biệt phù hợp với big data ) và hỗ trợ SQL, streaming data, machine learning và xử lý đồ thị.\r\n\r\nData lakes\r\nData lakes là các kho lưu trữ chứa khối lượng dữ liệu thô rất lớn ở định dạng gốc của nó cho đến khi những người dùng doanh nghiệp cần dữ liệu.\r\n\r\nCác yếu tố giúp tăng trưởng data lakes là những phong trào kỹ thuật số và sự phát triển của IoT. Các data lakes được thiết kế để giúp người dùng dễ dàng truy cập vào một lượng lớn dữ liệu khi có nhu cầu.\r\n\r\nNoSQL Databases\r\nCác cơ sở dữ liệu SQL thông thường được thiết kế cho các transaction đáng tin cậy và các truy vấn ngẫu nhiên.\r\n\r\nNhưng chúng có những hạn chế như giản đồ cứng nhắc làm cho chúng không phù hợp với một số loại ứng dụng. Cơ sở dữ liệu NoSQL nêu ra những hạn chế, và lưu trữ và quản lý dữ liệu theo những cách cho phép tốc độ hoạt động cao và sự linh hoạt tuyệt vời.\r\n\r\nNhiều cơ sở dữ liệu đã được phát triển bởi các công ty để tìm cách tốt hơn để lưu trữ nội dung hoặc xử lý dữ liệu cho các trang web lớn. Không giống như các cơ sở dữ liệu SQL, nhiều cơ sở dữ liệu NoSQL có thể được mở rộng theo chiều ngang trên hàng trăm hoặc hàng ngàn máy chủ.\r\n\r\nIn-memory databases\r\nCơ sở dữ liệu trong bộ nhớ (IMDB) là một hệ thống quản lý cơ sở dữ liệu chủ yếu dựa vào bộ nhớ chính (Ram), thay vì HDD, để lưu trữ dữ liệu. Cơ sở dữ liệu trong bộ nhớ nhanh hơn các cơ sở dữ liệu được tối ưu hóa trong đĩa, một điểm quan trọng để sử dụng phân tích big data và tạo ra các kho dữ liệu và các siêu dữ liệu. Đọc thêm Redis là gì?\r\n\r\nCác kĩ năng Big data\r\nBig data và các nỗ lực phân tích big data yêu cầu kĩ năng cụ thể, dù là từ bên trong tổ chức hay thông qua các chuyên gia bên ngoài.\r\n\r\nNhiều kĩ năng có liên quan đến các thành phần công nghệ dữ liệu quan trọng như Hadoop, Spark, NoSQL, cơ sở dữ liệu trong bộ nhớ và phần mềm phân tích.\r\n\r\nVới độ phổ biến của các dự án phân tích dữ liệu và sự thiếu hụt nhân lực về các kĩ năng trên, việc tìm kiếm các chuyên gia có kinh nghiệm có thể là một trong những thách thức lớn nhất đối với các tổ chức.', 3, 111752, 8),
(22, 'Hướng dẫn tạo một đối thủ AI đơn giản cho cờ vua', 'huong-dan-tao-mot-doi-thu-ai-don-gian-cho-co-vua', 'AI-Machine-Learning.jpg', 'Tác giả: Lauri Hartikka Chúng ta hãy cùng khám phá một số khái niệm cơ bản sẽ giúp chúng ta tạo ra một AI cờ...', '2022-03-23 05:31:32', 1, '2022-03-23 05:31:32', 'Chúng ta hãy cùng khám phá một số khái niệm cơ bản sẽ giúp chúng ta tạo ra một AI cờ vua đơn giản:\r\n\r\nmove-generation (Khởi tạo các bước di chuyển)\r\nboard evaluation (Khả năng tiên đoán nước cờ của đối thủ)\r\nminimax (Thuật toán tính toán nước đi)\r\nalpha beta pruning. (Tinh chỉnh phương thức Alpha-beta)\r\nỞ mỗi bước, chúng tôi sẽ cải tiến thuật toán bằng một trong những kỹ thuật lập trình game cờ vua đã qua thử nghiệm. Tôi sẽ chứng minh làm thế nào để tác động đến lối chơi của thuật toán.\r\n\r\nBạn có thể xem thuật toán AI hoàn chỉnh trên GitHub.\r\n\r\nBước 1: Hiển thị các bước di chuyển và bàn cờ\r\nChúng tôi sẽ sử dụng thư viện chess.js để phát triển các bước di chuyển và chessboard.js để hiển thị bàn cờ. Thư viện tạo ra các bước di chuyển cơ bản tuân theo tất cả quy luật của cờ vua. Dựa vào điều này, chúng ta có thể tính toán tất cả các bước đi hợp lý cho một ván chơi nhất định.\r\n\r\n\r\nHình dung chức năng tạo các nước đi. Dựa vào vị trí bắt đầu để tính toán ra tất cả các nước đi có thể từ vị trí đó.\r\nSử dụng các thư viện này sẽ giúp chúng ta có thể dồn toàn tâm toàn ý vào công việc thú vị nhất: tạo ra thuật toán tìm nước cờ tốt nhất.\r\n\r\nChúng ta sẽ bắt đầu bằng cách tạo ra một chức năng chỉ trả về một nước đi ngẫu nhiên từ tất cả hướng có thể:\r\n<code>\r\nvar calculateBestMove =function(game) {\r\n //generate all the moves for a given position\r\n var newGameMoves = game.ugly_moves();\r\n return newGameMoves[Math.floor(Math.random() * newGameMoves.length)];\r\n};\r\n</code>\r\nMặc dù thuật toán này không tạo nên đối thủ cứng tay, tuy nhiên đó là một khởi đầu tốt, chúng ta thực sự đã có thể chơi với nó:\r\n\r\n\r\nCờ đen tự di chuyển những nước đi ngẫu nhiên.\r\n Tổng hợp nguồn học Machine Learning tốt nhất\r\n Máy học - Machine Learning và một vài hạn chế.\r\nBước 2: Dự đoán các nước đi\r\nBây giờ chúng ta hãy cố gắng hiểu được bên nào mạnh hơn ở vị trí nào đó. Cách đơn giản nhất để đạt được điều này là tính toán sức mạnh tương đối của các quân cờ trên bàn bằng cách sử dụng bảng sau:\r\n\r\n\r\nVới chức năng dự đoán, chúng ta có thể tạo ra một thuật toán chọn nước cờ đạt hiểu quả cao nhất:\r\n<code>\r\nvar calculateBestMove = function (game) {\r\n\r\n var newGameMoves = game.ugly_moves();\r\n var bestMove = null;\r\n //use any negative large number\r\n var bestValue = -9999;\r\n\r\n for (var i = 0; i < newGameMoves.length; i++) {\r\n var newGameMove = newGameMoves[i];\r\n game.ugly_move(newGameMove);\r\n\r\n //take the negative as AI plays as black\r\n var boardValue = -evaluateBoard(game.board())\r\n game.undo();\r\n if (boardValue > bestValue) {\r\n bestValue = boardValue;\r\n bestMove = newGameMove\r\n }\r\n }\r\n\r\n return bestMove;\r\n</code>\r\nXem tiếp...\r\nCải tiến duy nhất đạt được là thuật toán của chúng ta sẽ nắm bắt được một phần phương thức di chuyển nếu có thể.\r\n\r\n\r\nCờ đen chơi với sự hỗ trợ của chức năng dự đoán đơn giản.\r\nBước 3: Tìm kiếm nước đi hiểu quả nhất bằng Minimax\r\nTiếp theo, chúng ta sẽ tạo ra các hướng đi có thể xảy ra từ đó thuật toán có thể chọn bước di chuyển tốt nhất. Điều này được thực hiện bằng cách sử dụng thuật toán Minimax.\r\n\r\nTrong thuật toán này, hướng đi của tất cả các nước cờ có thể được tính toán kỹ trong từng tình huống nhất định, và vị trí được dự đoán cuối cùng là hiệu quả nhất.\r\n\r\nSau đó, chúng ta sẽ trả lại giá trị nhỏ nhất hoặc lớn nhất của child cho parent node, tùy thuộc vào việc đó là cờ trắng hoặc đen để di chuyển. (Đó là, chúng tôi cố gắng để giảm thiểu hậu quả hoặc tối đa hóa hiệu quả ở mỗi tình huống.)\r\n\r\n \r\n\r\n\r\nHình dung thuật toán minimax cho trí thông minh nhân tạo. Nước đi tốt nhất cho cờ trắng là b2-c3, bởi vì chúng tôi có thể đảm bảo rằng tại vị trí mà tính toán là -50\r\n<code>\r\nvar minimax = function (depth, game, isMaximisingPlayer) {\r\n if (depth === 0) {\r\n return -evaluateBoard(game.board());\r\n }\r\n var newGameMoves = game.ugly_moves();\r\n if (isMaximisingPlayer) {\r\n var bestMove = -9999;\r\n for (var i = 0; i < newGameMoves.length; i++) {\r\n game.ugly_move(newGameMoves[i]);\r\n bestMove = Math.max(bestMove, minimax(depth - 1, game, !isMaximisingPlayer));\r\n game.undo();\r\n }\r\n return bestMove;\r\n } else {\r\n var bestMove = 9999;\r\n for (var i = 0; i < newGameMoves.length; i++) {\r\n game.ugly_move(newGameMoves[i]);\r\n bestMove = Math.min(bestMove, minimax(depth - 1, game, !isMaximisingPlayer));\r\n game.undo();\r\n }\r\n return bestMove;\r\n }\r\n</code>\r\nXem tiếp...\r\nVới minimax, thuật toán của chúng tôi bắt đầu hiểu một số chiến thuật cơ bản của cờ vua:\r\n\r\n\r\nMinimax tính toán được trước 2 nước đi.\r\nHiệu quả của thuật toán minimax chủ yếu dựa vào khám phá ra nước cờ tiếp theo đó mà chúng ta có thể đạt được. Đây là điều chúng tôi sẽ cải thiện trong bước tiếp theo.\r\n\r\n Tổng hợp nguồn học Machine Learning tốt nhất\r\n Máy học - Machine Learning và một vài hạn chế.\r\nBước 4: Tinh chỉnh Alpha-beta\r\nViệc tinh chỉnh Alpha-beta là một phương pháp tối ưu hóa thuật toán minimax cho phép chúng ta bỏ qua một số hướng trong tất cả hướng đi có thể. Điều này giúp chúng tôi dự đoán hướng bằng minimax hiệu quả, trong khi sử dụng cùng một thuật toán.\r\n\r\nViệc giảm thiểu alpha-beta dựa trên tình huống mà chúng ta có thể ngừng đưa ra hướng đi nếu chúng ta thấy hướng đi đó dẫn đến một kết quả tồi tệ hơn là bước di chuyển đã tìm ra từ trước.\r\n\r\nViệc điều chỉnh alpha-beta không ảnh hưởng đến kết quả của thuật toán minimax, nó chỉ làm cho thuật toán nhanh hơn.\r\n\r\nThuật toán alpha-beta cũng hiệu quả hơn nếu chúng ta tìm ra những hướng đi dẫn tới các nước cờ tốt đầu tiên.\r\n\r\n\r\nCác vị trí chúng ta không cần phải ngợi ý nếu việc tinh chỉnh alpha-beta được sử dụng và hướng đi tuân theo thứ tự được mô tả.\r\nVới alpha-beta, chúng tôi đạt được sự cải thiện đáng kể cho thuật toán minimax, như thấy trong ví dụ sau:\r\n\r\n\r\nTheo link này để thử phiên bản cải tiến alpha-beta của AI cờ vua.\r\n\r\nBước 5: Cải thiện chức năng dự đoán\r\nChức năng dự đoán ban đầu khá là đơn giản vì chúng chỉ đếm các nước đi được tìm thấy trên bàn cờ. Để cải thiện điều này, chúng tôi thêm vào dự đoán một yếu tố có tính đến vị trí của các quân cờ. Ví dụ, một con mã nằm ở giữa bàn cờ là tốt hơn (vì nó có nhiều lựa chọn hơn và vì vậy hoạt động mạnh hơn) so với một con mã trên mép của bàn cờ.\r\n\r\nChúng ta sẽ sử dụng các ô mà từng quân cờ có thể đi được dựa trên nguồn chess-programming-wiki nhờ vậy mà chất lượng AI được cải thiện.\r\n\r\n\r\nCác ô minh họa để dễ hình dung. Chúng tôi có thể tính được điểm tăng hay giảm của mỗi nước đi, tùy thuộc vào vị trí của mỗi quân cờ.\r\nVới những cải tiến sau đây, chúng tôi bắt đầu có được một thuật toán chơi cờ với những nước đi “hợp lý”, ít nhất là từ quan điểm của một kỳ thủ bình thường:\r\n\r\n\r\nCải thiện dự đoán và tinh chỉnh alpha-beta với khả năng tính toán trước được 3 nước đi. Có thể thử trên https://jsfiddle.net/q76uzxwe/1/\r\nKết luận\r\nSức mạnh của ngay cả một thuật toán chơi cờ vua đơn giản cũng có là không tạo ra những sai lầm ngu ngốc. Tuy nhiên, nó vẫn còn thiếu về phần lên chiến lược.\r\n\r\nVới các phương pháp tôi giới thiệu ở đây, chúng tôi đã có thể lập trình một thuật toán chơi cờ vua có thể chơi cơ bản. Về phần “AI” (các nước đi ngẫu nhiên bị loại bỏ) của thuật toán cuối cùng chỉ có 200 dòng code, điều này khá đơn giản để thực hiện. Bạn có thể kiểm tra phiên bản hoàn chỉnh trên GitHub.\r\n\r\nMột số cải tiến khác chúng tôi có thể thực hiện cho thuật toán như:\r\n\r\nmove-ordering (sắp xếp các nước đi)\r\nfaster move generation (tính toán các nước đi nhanh hơn)\r\nvà end-game specific evaluation. (dự đoán khi nào kết thúc ván cờ)\r\nNếu bạn muốn tìm hiểu thêm, hãy thử xem qua chess programming wiki. Đó là một nguồn thông tin hữu ích để bạn có thể khám phá vượt qua khái niệm cơ bản mà tôi giới thiệu ở bài này.\r\n\r\nCảm ơn bạn đã đọc bài viết này!', 3, 18559, 8),
(23, 'Hot trend AI, không hề “gắt” như bạn nghĩ', 'hot-trend-ai-khong-he-gat-nhu-ban-nghi', 'AI-Machine-Learning.jpg', 'Tác giả: Ryszard Szopa Thế giới đang nằm trong \"tâm bão\" AI - Trí tuệ nhân tạo: Các chuyên gia về Machine Learning thì \"hét\"...', '2022-03-23 05:35:35', 1, '2022-03-23 05:35:35', 'Thế giới đang nằm trong “tâm bão” AI – Trí tuệ nhân tạo: Các chuyên gia về Machine Learning thì “hét” mức lương “trên trời”, còn nhà đầu tư cũng “giang rộng vòng tay” đổ không ít vốn vào các startup AI. Vì thế mới nói: đây là một trong những công nghệ gây chuyển biến mạnh mẽ nhất những thập kỉ vừa qua. Nó đã đến, ở lại và sẽ thay đổi cục diện cuộc sống của chúng ta.\r\n\r\nTuy nhiên, nó không đồng nghĩa với việc làm startup AI dễ ăn – dễ sống. Có một số “bẫy ngầm” mà bất cứ ai gia nhập vào ngành này chắc chắn sẽ dẫm phải. Bạn có vượt qua nó không mới quyết định được thành bại của startup mình.\r\n\r\nNhững việc làm hấp dẫn\r\n\r\nPHP/ JavaScript Dev (fresh/junior ~ 1500$)\r\nCông ty cổ phần Base EnterpriseThành phố Hà Nội500 - 1,500 USD\r\nPHPOOPJavaScriptData Structure & AlgorithmHTML/CSS\r\n\r\nTest Automation Engineer (RMI)\r\nTecAlliance VietnamThành phố Hồ Chí MinhNegotiable\r\nAutomation Test\r\n\r\nDevOps Engineer\r\nV-KEYThành phố Hồ Chí MinhNegotiable\r\nDevOpsAWS\r\n\r\nCloud Data Engineer AWS (IM PSDS)\r\nTecAlliance VietnamThành phố Hồ Chí MinhNegotiable\r\nData EngineerPythonBig DataAWSCloud\r\n\r\nIT - Senior Software Tester - QC\r\nNGÂN HÀNG Á CHÂU (ACB)Thành phố Hồ Chí MinhNegotiable\r\nQCTesterPerformance TestingAutomation TestManual Test\r\n\r\n“Tôi và con trai” – bức tranh được vẽ hoàn toàn bằng Artistic Style Transfer – 1 dạng kỹ thuật Deep Learning gây không ít tranh cãi\r\n\r\nCác kỹ năng về AI đang bị “hạ giá”\r\nVào năm 2015 khi tôi vẫn còn ở Google và còn chơi DistBelief (đã được đổi tên lại là TensorFlow). Nói thật là: nó chán vê-lờ… Viết cũng thấy ngượng ngượng, phần abstraction chính cũng chẳng được như bạn kỳ vọng. Giấc mơ build nó ngoài hệ thống build của Google thật sự đúng như tên gọi: một GIẤC MƠ.\r\n\r\nĐến cuối năm 2016 thì tôi đang làm cho 1 project detect được bệnh ung thư dựa trên các ảnh mô bệnh (histopathological images). Lúc đó tôi muốn dùng transfer learning: bằng cách dùng Inception – công nghệ phân loại ảnh tốt nhất bấy giờ của Google, và “dạy” nó lại theo dữ liệu về bệnh ung thư tôi có. Tôi còn dùng những công nghệ của bản Inception trước-khi-train do Google cung cấp, chỉ thay đổi 1 chút ở phần layer trên cùng theo hướng tôi đang làm. Sau thời gian lăn lộn với TensorFlow, tôi cũng tìm ra được cách xử lý các layer khác nhau, và hầu hết đều hiệu quả. Nó đòi hỏi không ít kiên nhẫn và thời gian đọc lại source của TensorFlow. Ít ra tôi cũng không phải lo quá nhiều về các dependencies, vì những người làm TensorFlow đã (tốt bụng) chuẩn bị sẵn file docker.\r\n\r\nĐầu 2018 thì task trên không còn phù hợp với intern như tôi nữa. Cũng may nhờ có Keras (một framework nền của TensorFlow) chỉ cần vài dòng code Python là bạn đã có thể hoàn thành công việc, và cũng không đòi hỏi bạn phải am hiểu chuyên sâu về nó nữa. Cái “đau đầu” duy nhất còn lại đó là phần Hyper Parameter tuning. Nếu bạn dùng Deep Learning model, bạn có thể tận dụng các knob, số lượng và size của layer,… Việc tối ưu configuration thật ra cũng không quan trọng lắm, và một số thuật toán như grid search cũng không thật sự hiệu quả. Bạn có thể tiến hành nhiều thử nghiệm, bạn sẽ thấy trải nghiệm của vụ này giống như 1 công trình nghệ thuật hơn là một nghiên cứu khoa học.\r\n\r\nGiờ đây, khi đang ngồi mổ cò những dòng này (năm 2019), thì Google và Amazon đã offer các dịch vụ automatic model tuning (Cloud AutoML, SageMaker), phía Microsoft cũng đang lên lộ trình ra mắt các dịch vụ tương tự.\r\n\r\nĐến đây chắc bạn đã hiểu cái tôi đang muốn nói đến rồi. Những bài toán hóc búa trong quá khứ, giờ đã trở nên dễ dàng hơn. Giờ bạn có thể làm được những thứ khó nhằn, mà không cần tốn công sức quá nhiều. Những công trình kỹ thuật vĩ đại ngày xưa giờ đây đã bị gán mác “lỗi thời”, và bạn cũng chẳng cần kỳ vọng những cái ta đang làm hiện tại sẽ khủng hơn trong tương lai. Đây chẳng qua là dấu hiệu của sự tiến bộ. Chúng ta nợ một lời cảm ơn đến các công ty như Google đã tiêu tốn không ít nghiên cứu & phát triển nên tool để hỗ trợ chúng ta và publish nó free. Lí do họ làm nên những việc này cũng có 2 mặt của nó.\r\n\r\n\r\n\r\nVăn phòng của bạn sau khi được “tái cơ cấu”. \r\n\r\nĐầu tiên, đây là dạng Commoditize the complement (hàng hóa bổ sung) cho các sản phẩm hiện tại của họ, gọi là cloud infrastructure. Trong nền kinh tế, 2 món hàng mà bạn thường có xu hướng mua chung với nhau thì gọi là hàng hoá bổ sung, ví dụ: xe hơi mua chung xăng, sữa mua chung ngũ cốc, trứng thì mua chung với thịt. Nếu giá của 1 trong 2 giảm, thì cầu của nó tăng dẫn đến cầu của cái còn lại sẽ tăng. Phần “hàng hóa bổ sung” của cloud chính là phần mềm chạy trên đó, và nhờ đó, những thứ công nghệ liên quan đến AI cũng có một nguồn tài nguyên dồi dào để có thể triển khai một cách dễ dàng. Vì thế, Google cũng giải quyết được vấn đề chi phí -> về lâu về dài, việc phát triển công nghệ này sẽ trở nên tiết kiệm hơn.\r\n\r\nLí do thứ 2 mà Google lại rất hứng thú với AI là vì họ sẽ dành được lợi thế tương đương so với các đối thủ trên thị trường như Amazon và Microsoft. Họ làm nó trước, và chính họ là người mang concept Deep Learning ra thế giới, vì thế mà họ có rất nhiều nhân tài trong đội ngũ. Họ có nhiều kinh nghiệm về phát triển sản phẩm AI, từ đó tạo được nhiều ưu thế khi phát triển tool và dịch vụ ra ngoài thị trường.\r\n\r\nNghe có vẻ hay, nhưng đây là tin buồn cho cả công ty và các cá nhân đang nghiên cứ các kĩ năng AI. Ngày nay, họ sẽ cho bạn nhiều lợi thế cạnh tranh, vì một kĩ sư Machine Learning đủ chuẩn cần rất nhiều thời gian để đọc tài liệu, và phát triển background về toán thật vững để bắt tay vào việc. Tuy nhiên, vì tool có sẵn càng ngày càng tốt và hữu ích, lúc này skill của bạn lại bắt đầu “bớt hiệu lực”. Luật chơi bây giờ sẽ là “đọc hướng dẫn sử dụng” hơn là “đọc nghiên cứ tài liệu”. Nếu bạn không sớm nhận ra ưu thế của mình, đến intern cũng có thể ăn mất phần của bạn. Đặc biệt, nếu intern có data tốt hơn, và câu chuyện chưa dừng lại ở đó…\r\n\r\nData mới là thứ quan trọng hơn so với đống AI Architecture hào nhoáng!\r\nHãy cùng bàn về case của 2 startup founder, Alice và Bob. Côn ty của họ kêu gọi được cùng lượng tiền, và cạnh tranh khốc liệt trên cũng 1 thị trường. Alice đầu tư vào những kĩ sư giỏi nhất, từ PhD đến Doctor công nghệ siêu sao. Bob thì chỉ thuê các kĩ sư tầm trung, và đầu tư phần lơn vào bảo toàn data hiện có. Vậy công ty nào là lựa chọn của bạn?\r\n\r\nTôi sẽ nằm kèo anh Bob trong lần này. Tại sao? Machine learning hoạt động dựa trên một dataset và chuyển hoá nó vào các model weight. Một model tốt hơn sẽ hiệu quả hơn trong process này (về thời gian và năng suất chung), nhưng theo một số chuẩn thông thường, data tốt hơn sẽ mang đến architecture tốt hơn.\r\n\r\nĐể chứng minh luận điểm này, hãy thực hiện test sau. Tôi sẽ làm tạo các convolutional network đơn giản, một cái “ngon” và một cái “không ngon bằng”. Layer cuối cùng của bản “ngon” có 128 neuron, còn cái còn lại chỉ có khoảng 64 cái. Tôi đã “dạy” nó về subsets của MNIST dataset của size, và cho sẵn độ chính xác của model trên test set so với số sample mà chúng được học.\r\n\r\n\r\n\r\nMàu xanh dương là model “ngon” hơn, màu xanh lá là model “xấu” hơn\r\n\r\nHiệu ứng tích cực của việc set dataset size rất rõ ràng (ít nhất cũng đến khi model bắt đầu fit và ổn định). Model “ngon” hơn – line màu xanh dương, rõ ràng sẽ làm tốt hơn so với cái kia – line xanh lá. Tuy nhiên, cái tôi muốn nhấn mạnh là độ chính xác của line xanh lá sau khi được học trên 40k mẫu lại tốt hơn hẳn so với line xanh dương chỉ được luyện trên 30k mẫu.\r\n\r\nĐiểm mấu chốt ở đây là, kĩ sư của Alice không chỉ đang cạnh tranh với kĩ sư của Bob. Nhờ có văn hoá mở của cộng đồng AI và tầm quan trọng của việc chia sẻ kiến thức, họ cũng đang chạy đua với cả các researcher tại Google, Facebook, Microsoft, và cả ngàn trường đại học trên thế giới. Sử dụng architecture phù hợp nhất cho data của bạn là một cuộc chiến thử nghiệm về chiến lược nếu như mục tiêu của bạn là giải quyết vấn đề (ngược lại với việc cống hiến bản gốc cho khoa học). Nếu không có sẵn những cái hiệu quả, việc đợi người mang giải pháp đến chỉ là vấn đề về thời gian. Bạn thậm chí có thể tổ chức một cuộc thi Kaggle để khuyến khích các researcher nghiên cứu phân tích vấn đề cho bạn.\r\n\r\nKĩ sư tốt là quan trọng, nhưng nếu bạn đang làm về AI, thì data mới là ưu thế cạnh tranh. Câu hỏi “Ai là triệu phú” ở đây đó là: Liệu bạn có khả năng tin tưởng vào data và giữ vững được lợi thế của mình không.\r\n\r\nGiữ vững lợi thế cạnh tranh trong ngành AI là cực khó!\r\nVới đống dữ liệu dataset khủng, Bob đã dành ưu thế hoàn toàn so với Alice. Bob launch được sản phẩm và dần dành lấy được nhiều thị phần. Chưa kể Bob đã bắt đầu thuê các kĩ sư cao cấp hơn, vì công ty của Bob đã ở một tầm cao mới.\r\n\r\n\r\n\r\nRồi một ngày Chuck xuất hiện, Chuck rất giàu, có nhiều tiền, nhưng Chuck sẽ phải làm rất nhiều thứ để bắt nhịp được cuộc chơi. Ném một đống tiền vào không đảm bảo việc một project có chạy nhanh hay không. Chưa kể, việc cố gắng gượng ép đưa càng nhiều kỹ sư vào lại còn gây hại hơn, dễ gây rối loạn tình hình. Tuy nhiên, việc tạo ra dataset thì lại khác. Thường thì nó cần rất nhiều nhận lực tay chân, thì bạn sẽ phải chi tiền để thuê thêm người. Hoặc có khi chỉ cần 1 người có thật nhiều data – khi đó tất cả những gì bạn phải làm đó là chi tiền cho license đó. Lúc này thì tiền mới thật sự có tác dụng.\r\n\r\nTại sap Chuck lại có thể kêu gọi được nhiều tiền đầu tư hơn Bob?\r\n\r\nKhi một founder kêu gọi vốn được 1 vòng, họ thường sẽ cố gắng đi hai hàng, một là thêm thật nhiều tiền vào, tuy nhiên không được quá nhiều vì cổ phần sẽ bị pha loãng (dilute), Thêm một nhà đầu tư đồng nghĩa với việc bán đi một phần của công ty. Team lãnh đạo phải phải kiểm soát đủ cổ phần trong startup, để không mất động lực và tiền (làm startup khổ lắm quý vị, thật!…)\r\n\r\nMặc khác, nhà đầu tư lại muốn bơm tiền vào những ý tưởng tiềm năng, nhưng cũng phải kiểm soát rủi ro. Nếu rủi ro dự kiến tăng cao, thì họ sẽ kỳ vọng nhiều hơn trên mỗi đồng họ đã đầu tư.\r\n\r\nKhi Bob kêu gọi vốn, việc AI sẽ giúp cho sản phẩm vượt trội hơn là điều không tưởng. Dù Bob và team xuất chúng đến đâu thì chuyện bị lên án chỉ trích là không thể tránh khỏi. Trường hợp của Chuck lại khác. Anh ấy hiểu rõ vấn đề, mọi thứ đều nằm trong tầm tay: Sản phẩm của Bob đã là bằng chứng “sống” rõ ràng nhất.\r\n\r\nBob đã đáp trả lại thử thách này bằng cách tiếp tục kêu gọi vòng khác. Bob vẫn đang dẫn đầu cuộc đua. Tuy nhiên tình hình lại phức tạp hơn, nếu như Chuck có thể bảo toàn được quyền access data bằng quan hệ hợp tác thì sao? Thử nghĩ về một startup chẩn đoán bệnh ung thư đi. Chuck hoàn toàn có thể dùng vị trí ngầm nào đó trong một viện y tế để bảo toàn deal với viện đó. Và Bob sẽ không bao giờ có đủ tài chính để làm chuyện đó.\r\n\r\n\r\n\r\nVậy nên, làm sao để giữ được ưu thế cạnh tranh của sản phẩm AI? Không lâu trước tôi đã vinh hạnh được nói chuyện với Antonio Criminisi của Microsoft Research. Bí mật nằm ở chỗ, chìa khóa của sản phầm không nên chỉ nằm ở AI (AI only), tức là không nên bỏ trứng vào cùng 1 rổ. Ví dụ, InnerEye project của anh ấy sử dụng AI và công nghệ computer vision truyền thống (không dựa trên ML) để phân tích các ảnh chụp x-quang. Khả năng đưa data vào một model và xem nó hoạt động thế nào khá là hay. Tuy nhiên, với một yếu tố kết hợp dùng AI với phần mềm truyển thống, sản phẩm của bạn sẽ khó đoán hơn, vì loại yêu cầu các lập trình viên phải suy nghĩ về các thuật toán và sử dụng một số kiến thức khó để có được kiến thức về miền, nói chung là rất khó để đối thủ có thể nắm bắt được.\r\n\r\nAI chỉ nên được dùng như một “đòn bẩy”.\r\nMột trong những cách để phân loại một doanh nghiệp chính là xem xét xem mô hình kinh doanh ấy đang thêm thắt giá trị gì cho những đối tác xung quanh. Hãy xem công ty e-commerce sau làm ví dụ. Nếu bạn tạo ra 1 dòng sản phẩm mới tức là bạn đang thêm giá trị trực tiếp. Trước đó chẳng có gì, giờ đây đã có widget và khách hàng sẽ chi tiền để mua nó. Còn cho ra một kênh phân phối mới, cái đó gọi là đòn bẩy. Bằng cách bán widget mới của bạn trên Amazon, tức là bạn đang nhân đôi lượng bán ra. Cắt giảm chi phí cũng được gọi là đòn bẩy. Nếu bạn thương lượng được một deal ngon với một nhà cung cấp từ Trung Quốc, bạn cũng đang nhân đôi lợi nhuận gộp (gross margin) của mình nữa.\r\n\r\nHãy tư duy theo kiểu thế này, chiếc đòn bẫy chỉ đóng vai trò như một lực đẩy nhẹ giúp bạn đi xa hơn, không nên gượng ép ứng dụng nó vào sản phẩm. Luôn nhớ rằng, đòn bẫy chỉ thật sự hữu ích khi nó được kết nối với một nguồn data giá trị, cũng giống như việc nếu bạn không có đủ loại hàng để bán, thì việc đẩy thêm kênh phân phối dường như không mang lại nhiều giá trị.\r\n\r\nVậy thì nhân tố AI ở đâu để chúng ta hiểu? Có rất nhiều công ty đang cố đưa AI trực tiếp vào sản phẩm của mình (vd: các API nhận diện hình ảnh và những cái tương tự). Đối với các chuyên gia AI thì còn gì hấp dẫn hơn được nữa. Tuy nhiên, đây là một ý tưởng khá fail.\r\n\r\nMột là, bạn đang cạnh tranh với Google và Amazon. Thiệt luôn…\r\nHai là, việc tạo ra sản phẩm AI thuần một cách tỉ mỉ là việc khó không tưởng. VD: Tôi muốn dùng Vision API của Google. Đáng tiếc là, chúng tôi chưa reach đến được nhóm đối tượng có nhu cầu phù hợp. Nó hoặc hơi quá mức, hoặc chưa đủ đô, có khi lại cả hai…\r\nMột lựa chọn hay hơn đó là đúng AI như một “đòn bẩy”. Bạn có thể dùng model hiện tại sẵn có và tăng tốc nó bằng AI. VD, nếu bạn đang có 1 quy trình tốn nhiều nhân lực người làm, việc tự động hoá đó sẽ mang đến điều kì diệu. Một số ví dụ điển hình sẽ là ECG analysis, industrial inspection, satellite image analysis. Chính bởi vị AI nằm ở phía backend, bạn sẽ có nhiều option AI hơn để build và giữ được ưu thế cạnh tranh.\r\n\r\nKết luận\r\nAI là một công nghệ thực sự xoay chuyển cuộc chơi. Thế nhưng xây dựng công ty của bạn phụ thuộc vào nó lại là một câu chuyện khác. Bạn không nên quá phụ thuộc vào các kĩ năng về AI, vì chúng đang dần bị “hạ giá” trên xu hướng thị trường nói chung. Việc xây dựng các AI model có vẻ thú vị thật, nhưng cái quan trọng là phải có nguồn data tốt hơn. Giữ lợi thế cạnh tranh đã khó, đặc biệt là khi gặp thằng đối thủ siêu giàu nữa thì nguy cơ cao đó là AI của bạn sẽ bị “nuốt chửng”. Bạn nên hướng về một process data scalable nào mà khó có thể bị bắt chước bởi đối thủ. AI sẽ là cách tiếp cận tốt nhất cho những công việc không cần quá nhiều nhận thức và đầu óc con người, vì sức mạnh lớn nhất của nó là tự động hoá.', 3, 10415, 8);
INSERT INTO `post` (`post_id`, `post_title`, `slug`, `thumbnail`, `summary`, `updatedAt`, `published`, `publishedAt`, `content`, `user_id`, `viewcount`, `category_id`) VALUES
(24, 'Hướng triển khai cho các project Machine Learning', 'huong-trien-khai-cho-cac-project-machine-learning', 'AI-Machine-Learning.jpg', 'Với sự phát triển không ngừng của công nghệ, đâu đâu người ta cũng nhắc tới Cách mạng công nghiệp 4.0. Trong bối cảnh đó, Học máy (Machine Learning) đã trở thành một cái tên không còn xa lạ trong giới công nghiệp. Cùng với nhu cầu ngày càng nhiều của xã hội, một ngành mới được ra đời, Kĩ sư Học máy (Machine Learning Engineers).', '2022-03-23 05:37:34', 1, '2022-03-23 05:37:34', 'Kĩ sư Học máy là người có cả kĩ năng về Học máy và Kĩ thuật phần mềm (Software Engineering). Một Kĩ sư Học máy có thể sử dụng các kĩ năng của mình để tìm ra những mô hình học máy có hiệu suất cao đem vào ứng dụng và cũng là người xử lý các vấn đề từ cơ sở hạ tầng phục vụ huấn luyện cho đến tạo ra mô hình áp dụng thực tế. Có kha khá nguồn tài liệu trên mạng để một Kỹ sư phần mềm hay bất cứ ai học về Học máy. Tuy nhiên, trong thực tế, một đội ngũ làm Học máy sẽ phải đối mặt với vấn đề: Làm sao để có thể quản lý các tiến trình của dự án như các dự án phần mềm truyền thống ? Sau đây là bài viết trả lời cho câu hỏi đó.\r\n\r\nThe ML Engineering Loop\r\nTrong bài viết này, chúng mình sẽ cùng tìm hiểu về khái niệm “OODA Loop” của Học máy: ML Engineering Loop, với khái niệm này một Kỹ sư sẽ tuần tự theo các bước\r\n\r\nPhân tích (Analyze)\r\nChọn phương pháp (Select an approach)\r\nThực thi (Implement)\r\nĐo đạc (Measure)\r\nđể có thể tìm ra được mô hình học máy hiệu quả một cách nhanh chóng. Đối với mỗi giai đoạn sẽ có những lời khuyên mà tác giả nghĩ có thể hữu ích trong việc tối ưu toàn bộ quá trình.\r\n\r\nHướng triển khai cho các project Machine Learning\r\nMột đội ngũ ML thành công khi triển khai được mô hình có hiệu suất cao với những rằng buộc đã cho (ví dụ: đạt độ chính xác cao nhưng vẫn phải đảm bảo về bộ nhớ, thời gian chạy, etc). Hiệu suất (performance) được định nghĩa là đơn vị đo liên quan nhất tới thành công của sản phẩm cuối. Hiệu suất sẽ được dịch sang ngôn ngữ tương ứng của Học máy để quy về các độ đo. Trong ví dụ dưới đây, tác giả sẽ chọn “error rate” là đơn vị đo hiệu suất.\r\n\r\nKhi mới bắt đầu, bạn nên định nghĩa ra tiêu chí như nào thì gọi là thành công. Dưới góc nhìn về sản phẩm, theo bạn, hiệu suất như thế nào thì bắt đầu gọi là hữu dụng? Ví dụ như hệ thống của bạn gợi ý ra 5 bài báo liên quan, ít nhất bao nhiêu trong số đó cần phải thực sự liên quan, và thế nào là liên quan ?\r\n\r\nML Engineering Loop sẽ giúp bạn định hình được quá trình phát triển, đơn giản hóa quá trình quyết định để có thể tập trung hơn vào bước tiếp theo. Khi đã quen dần với vòng lặp này, bạn sẽ có thể nhanh chóng luân phiên giữa phân tích và thực thi. Vòng lặp này còn hữu ích kể cả khi bạn đã là chuyên gia, bạn sẽ không bị ngợp hay mông lung khi mô hình không đáp ứng yêu cầu hay đột nhiên mục tiêu của nhóm thay đổi.\r\n\r\nBắt đầu nào\r\nĐể có thế “kích” vòng lặp, hãy bắt đầu từ một phiên bản đơn giản. Mục đích của việc “kích” này là để có 1 con số cho chúng ta đánh giá, làm cơ sở cho việc đánh giá sau này. Nó sẽ bao gồm các việc sau:\r\n\r\nChuẩn bị dữ liệu training, development và testing.\r\nÁp dụng một mô hình đơn giản chạy được.\r\nVí dụ, có thể sử dụng các dữ liệu tương tự có sẵn từ một cuộc thi trên Kaggle cho huấn luyện tập train, dữ liệu thu thập tay cho tập development và test. Về mô hình có thể chọn hồi quy tuyến tính (logistic regression) với dữ liệu các pixel gốc hay chạy một mô hình đã huấn luyện sẵn (pre-trained network). Nên nhớ rằng, mục đích là chỉ cần chạy được, để khởi động cho vòng lặp.\r\n\r\nLời khuyên\r\n\r\nVề tập test:\r\n\r\nVì mục đích là làm tốt trên tập test, vậy nên tập test cần phản ánh chính xác mục đích sản phẩm hay thương mại của dự án. Ví dụ khi bạn đang xây dựng 1 ứng dụng chẩn đoán tình trạng của da người qua ảnh selfie, bạn có thể train trên bất cứ dữ liệu nào, nhưng hãy đảm bảo dữ liệu test sẽ chứa những ảnh ánh sánh yếu, chất lượng kém như ảnh selfie.\r\nThay đổi tập test sẽ là thay đổi mục tiêu của nhóm, vậy nên nếu có thay đổi thì nên thay đổi sớm, và chỉ nên thay đổi khi có thay đổi về dự án, sản phẩm hay mục tiêu thương mại.\r\nTập test và development cần phải đủ lớn để dữ liệu không bị nhiễu, đủ chính xác cho mục đích đánh giá, so sánh các mô hình.\r\nCẩn thận với nhãn của dữ liệu, vì mỗi điểm dữ liệu sai sẽ tương ứng với một lỗi trong yêu cầu của sản phẩm (Product requirement)\r\nNên biết hiệu suất của người hoặc các hệ thống đã có trên tập test. Đó sẽ là một giới hạn trên “error rate” giúp bạn xác định hiệu suất tốt nhất có thể đạt được.\r\nĐạt tới hiệu suất tương tự con người thường là mục tiêu dài hạn. Bởi cho đến cuối cùng, mục tiêu là tối ưu hiệu suất đến gần với chính con người nhất có thể.\r\nVề tập development và train:\r\n\r\nTập development đại diện cho tập test, được sử dụng để điều chỉnh các siêu tham số (hyper-parameters). Như vậy, tập này cần có phân phối dữ liệu gần với tập test, nhưng không được giống hệt, cùng một nhóm người dùng, đầu vào. Có một cách hay được sử dụng đó là xáo dữ liệu lên rồi chia ra tập development và test (sao cho phân phối hai tập tương đương).\r\nNếu bạn nghĩ rằng dữ liệu sản phẩm có thể bị nhiễu, hãy xử lý nó ở tập train bằng các phép gia tăng (augmentation) và giảm chất lượng (degradation) dữ liệu. Không thế kì vọng mô hình chỉ học ảnh sắc nét mà lại đoán tốt trên ảnh mờ được.\r\nMột khi đã có bản prototype, bạn có thể kiểm tra hiệu suất trên các tập dữ liệu. Đây cũng là bước cuối của vòng lặp. Đo đạc các biến động của khoảng cách giữa hiệu suất test và hiệu suất mong muốn đáp ứng tiêu chí hữu dụng của sản phẩm. Giờ là lúc bắt đầu vào chu trình của chúng mình.\r\n\r\nHướng triển khai cho các project Machine Learning\r\nPhân tích (Analyze)\r\nXác định “nút thắt cổ chai” (bottleneck)\r\nGiai đoạn Phân tích cũng khá giống trong y học: Bạn được trang bị một số phương pháp chẩn đoán và mục tiêu là kết luận được cái gì đã giới hạn hiệu suất của mô hình. Tìm ra những vấn đề dễ dàng thấy được trước, hiểu được tác nhân nào có tác động lớn nhất tới vấn đề đó, bạn không cần phải cố gắng hiểu cũng như giải quyết tất cả các vấn đề, bởi rất nhiều vấn đề nhỏ sẽ thay đổi và thậm chí là biến mất khi mô hình được cải thiện.\r\n\r\nDưới đây là danh sách một số phương pháp cũng với chẩn đoán. Việc chọn ra phương pháp nào cũng là một nghệ thuật, sau khi áp dụng nhuần nhuyễn ML Engineering Loop bạn sẽ có được “trực giác” để biết mình nên thử cái nào.\r\n\r\nĐiểm bắt đầu của chúng mình có lẽ là để ý tới hiệu suất training, development và testing. Ở mỗi một chu trình, bạn nên thống kê các con số ở bước cuối cùng một cách tự động. Thông thường, training error ⩽⩽ development set error ⩽⩽ test set error\r\n\r\nPhương pháp và chẩn đoán\r\nNếu training set error là nhân tố gây hạn chế hiệu suất, có thể do những vấn đề sau:\r\n\r\nThuật toán tối ưu không được hiệu chỉnh đúng. Nhìn vào learning curve để xem hàm loss có giảm không. Liệu mô hình có thể overfit một lượng dữ liệu nhỏ hơn không. Bạn có thể vẽ ra histogram của các phản hồi từ neuron để kiểm tra tính bão hòa (saturating)\r\nTập train có thể chứa dữ liệu đánh sai nhãn hoặc lỗi. Dò xét kĩ tập train trước khi đem vào mô hình để học.\r\nMô hình có thể quá bé. Ví dụ khi bạn dùng mô hình hồi quy tuyến tính cho bài toán phi tuyến tính, mô hình sẽ không tài nào học được. Khi đó ta nói mô hình high biashay underfitting\r\nNếu development set error là nhân tố đó, các vấn dề khá tương tự:\r\n\r\nMô hình có thể quá lớn, quá phức tạp. Khi đó ta nói mô hình high variance hay overfitting\r\nDữ liệu chưa đủ để học hết các pattern\r\nPhân phối của tập train không giống với tập development và test\r\nCác siêu tham số chưa hiệu quả. Nếu bạn đang sử dụng một số phương pháp để tìm các siêu tham số này, nhiều khi chính phương pháp đó thật sự không hiệu quả.\r\nThành phần encode đầu vào cho mô hình thực sự không phù hợp với dữ liệu.\r\nVà nếu test set error là nhân tố hạn chế, thì thường lý do là tập development quá nhỏ hay các bạn đã overfitting trên tập development qua nhiều thí nghiệm.\r\n\r\nVới bất kỳ lý do nào kể trên, bạn đều có thể phân tích tập những mẫu dữ liệu mà mô hình đã học sai để hiểu bản chất vấn đề (Nhưng tuyệt đối không nên làm với tập test nhé để tránh “huấn luyện” trên những mẫu này).\r\n\r\nXác định các lỗi phổ biến bằng cách biểu diễn trực quan dữ liệu (visualizing the data). Nắm được tần suất của các loại lỗi trên dữ liệu. Trong bài toán phân loại (classification) confusion matrix sẽ giúp dễ dàng xác định được những class mà mô hình học tệ nhất. Sau đó bạn có thể tập trung vào giải quyết các loại lỗi đó.\r\nMột số mẫu có thể bị đánh nhãn sai hoặc có nhiều hơn một nhãn.\r\nMột vài mẫu có thể khó học hơn cái khác, hoặc bị thiếu thông thông tin. Hãy đánh mác lại cho các mẫu dữ liệu, có dữ liệu sẽ là “rất khó” và có dữ liệu lại “rất dễ”, kiểm soát được điều này sẽ giúp bạn tối ưu hơn trong việc giải quyết lỗi nào trước.\r\nMột số chẩn đoán nêu trên sẽ có các khắc phục hiển nhiên, ví dụ như thiếu dữ liệu thì sẽ lấy thêm. Tuy nhiên, việc chia tách giai đoạn phân tích và chọn phương pháp sẽ giúp bạn hiểu rõ bản chất, phân tích các lỗi với một tâm thế thoải mái hơn.\r\n\r\nChọn phương pháp (Select Approach)\r\nTìm cách đơn giản nhất để giải quyết “nút thắt cổ chai”\r\nSau bước phân tích ở trên thì bạn đã hình dung được mình đang phải đối phó với những loại lỗi nào và tác nhân gây ra chúng rồi. Với một chẩn đoán, có thể sẽ có nhiều giải pháp khác nhau, bước tiếp theo chính là liệt kê và đánh giá độ ưu tiên cho chúng.\r\n\r\nTác giả khuyên rằng các Kĩ sư Học máy nên liệt kê ra càng nhiều ý tưởng càng tốt rồi bám theo những giải pháp đơn giản và nhanh. Nếu đã có sẵn một giải pháp có vẻ ổn thì dùng nó luôn. Có thể các phương pháp tinh vi, phức tạp sẽ cho kết quả tốt hơn, tuy nhiên qua thực tế tác giả thấy rằng sự cải thiện qua nhiều chu trình sẽ cho ra kết quả không tồi, hơn là chỉ chăm chăm sử dụng một giải pháp state-of-the-art, tốn khá nhiều thời gian. Giữa việc dán nhãn 1000 dữ liệu với nghiên cứu một phương pháp học không giám sát (unsupervised learning), mình nghĩ bạn nên thu thập và dán nhãn dữ liệu. Nếu như có một số heuristic đơn giản, bạn cũng nên thử chúng trước.\r\n\r\nLời khuyên\r\n\r\nPhụ thuộc và chẩn đoán ma sẽ có một số giải pháp phổ biến như sau\r\n\r\nNếu bạn muốn hiệu chỉnh thuật toán để phù hợp dữ liệu hơn:\r\n\r\nThử điều chỉnh learning rate hay momentum. Bắt đầu với momentum nhỏ thôi (0.5).\r\nThử các chiến thuật khởi tạo khác nhau, hay bắt đầu với một mô hình pre-trained\r\nThử mô hình dễ hiệu chỉnh. Trong Deep learning, residual networks hay mạng sử dụng batch normalization có thể dễ hơn để huấn luyện\r\nNếu mô hình không thế phù hợp với dữ liệu train:\r\n\r\nSử dụng mô hình phức tạp hơn. Ví dụ khi dùng Cây quyết định (Decision tree), bạn có thể làm cho cây sâu hơn chẳng hạn.\r\nKiểm tra các mẫu trong tập train mà mô hình cho kết quả sai. Đầu tư thời gian vào làm sạch dữ liệu.\r\nNếu mô hình không khái quát được tập development:\r\n\r\nThêm dữ liệu train. Chú ý thêm dữ liệu mà giống với loại lỗi trên tập developemnt.\r\nTăng dữ liệu bằng cách sử dụng các kĩ thuật khác nhau, ví dụ như trong xử lý ảnh có thể dùng OpenCV để thêm hiệu ứng sương mù cho ảnh, làm ảnh mờ đi.\r\nThử các siêu tham số ở một khoảng rộng hơn để đảm bảo tìm được mô hình với hiệu suất tốt nhất.\r\nThử các biến thể khác của regularization (như weight decay, dropout, pruning)\r\nThử một loại mô hình khác. Trong Deep learning thì việc thử các mô hình rất thuận tiện vì các mạng neural thường được dựng thành các “building block” dễ dàng sử dụng. Nếu bạn sử dụng các mô hình truyền thống thì phần lớn công việc sẽ là tìm cách thay mô hình. Nhưng dù sao vẫn nên nhớ rằng, thử cái nào dễ trước nhé.\r\nHướng triển khai cho các project Machine Learning\r\nThực thi (Implement)\r\nDựng cái gì bạn cần và làm nó thật nhanh\r\nVậy là bạn đã biết mình cần phải thử cái gì, bạn cũng đã làm cho nó đơn giản nhất có thể rồi. Giờ CHỈ cần bắt tay vào implement thôi. Mục tiêu của giai đoạn này là để nhanh chóng thử ý tưởng của bạn để có thể đo đạc, học từ đó và quay lại chu trình nhanh chóng. Do vậy, bạn chỉ nên làm những thử thực sự cần thiết. Tuy là nhanh nhưng bạn vẫn phải đảm bảo code của mình đúng nhé, hãy kiểm tra thường xuyên.\r\n\r\nLời khuyên\r\n\r\nKhi thu thập và dán nhãn dữ liệu:\r\n\r\nThường xuyên kiểm tra dữ liệu. Kiểm tra dữ liệu thô, dữ liệu sau khi xử lý và nhãn. Bạn có thể sẽ tìm ra rất nhiều lỗi bằng việc kiểm tra thường xuyên dữ liệu của bạn đó.\r\nDán nhãn và làm sạch dữ liệu là điều hết sức bình thường. Nhiều người khá ngại việc thu thập và dán nhãn dữ liệu, đánh giá thấp bài toán với ít dữ liệu. Khi đã vào guồng thì bạn hoàn toàn có thể dán nhãn 20 cái ảnh trong một phút đấy. Bạn muốn dành một tiếng dán nhãn và một tiếng giải bài toàn phân loại với dữ liệu gồm 1200 ảnh hay là dành 3 tuần để có một mô hình học từ 5 mẫu ?\r\nKhi bạn code một mô hình mới. Hãy bắt đầu từ những code tương tự. Có rất nhiều bài báo có mã nguồn mở trên mạng. Việc này sẽ giúp bạn tiết kiệm khối thời gian. Tác giả gợi ý các bước thực thi như sau:\r\n\r\nTìm một mã nguồn đã giải quyết vấn đề tương tự\r\nChạy lại mã nguồn với cùng tập dữ liệu và các siêu tham số.\r\nTừ từ hiệu chỉnh mô hình và luồn dữ liệu sao cho phù hợp với những gì bạn cần.\r\nViết lại những phần cần thiết.\r\nViết đoạn mã kiểm thử gradients, các giá trị của tensor, dữ liệu đầu vào và nhãn xem đúng quy định chưa. Làm điều này ngay từ đầu sẽ giúp bạn kiểm tra lỗi bất cứ khi nào.\r\n\r\nHướng triển khai cho các project Machine Learning\r\nĐo đạc (Measure)\r\nIn ra các kết quả cũng như các số liệu để tiện theo dõi.\r\n\r\nNếu hiệu suất tăng, bạn đang đi đúng đường. Bạn có thể làm sạch các thành phần (component) mà bạn đang làm và đảm bảo rằng thí nghiệm có thể thực hiện lại được bởi cách thành viên khác trong đội.\r\n\r\nNgược lại, khi hiệu suất không tăng đáng kể thậm chí có thể tệ hơn, bạn phải quyết định nên tiếp tục hay bỏ ý tưởng hiện tại đi. Bỏ đi là khá dễ nếu như mỗi chu trình trong ML Loop có chi phí rẻ: bạn không tốn quá nhiều công để làm code “hoàn hảo”, và một lần thử nữa cũng không quá lâu.\r\n\r\nLời khuyên\r\n\r\nCác số liệu đo hiệu suất bao gồm: độ chính xác, loss bên ML và những giá trị thương mại. Trong đó, những giá trị thương mại là thứ quan trọng nhất, bởi nó quyết định tính hữu dụng của thứ bạn đang làm. Nếu số liệu test (tối ưu bởi các thuật toán Học máy) của bạn không phù hợp với số liệu thương mại thì đây là lúc thích hợp để thay đổi các tiêu chí tối ưu hay tập test.\r\nĐây cũng là lúc bản có thể tính toán các số liệu khác cần thiết dựa trên những số liệu đang có. Điều này sẽ giúp ích ở giai đoạn phân tích hoặc để quyết định xem có nên dừng ý tưởng hiện tại không.\r\nThêm một điều nhỏ nữa, bạn hãy tạo ra một cái Dashboard cho các số liệu để quan sát sau mỗi thí nghiệm. Cái này đặc biệt hữu ích trong làm việc nhóm nhé.\r\nTối ưu vòng lặp\r\nML Engieering Loop sẽ giúp bạn hình dung rõ về quá trình để có được một mô hình tốt hơn. Đây không phải là một hướng dẫn chi tiết, bạn sẽ phải phát triển khả năng của bản thân để có thể đưa ra sự lựa chọn hợp lý ở mỗi gia đoạn. Bạn cần phải làm quen nhanh chóng với các chu trình này, tìm cách cải tiến vòng lặp về cả chất lượng và tốc độ để có thể tối đa hóa các quá trình ở mỗi chu trình và nhiều chu trình trong thời gian ngắn.\r\n\r\nLời khuyên\r\n\r\nNếu giai đoan phân tích đang chậm, viết script để tóm tắt các kết quả, thu thập lỗi từ tập train, dev và biểu diễn một cách dễ nhìn. Cái “dashboard” này cực kỳ hữu ích cũng như tiết kiệm thời gian.\r\nNếu bạn vẫn đang mông lung không biết nêu thử cái gì, chỉ cần chọn đại một cái. Thử nhiều thứ một lúc sẽ khiến bạn chậm hơn. Bạn vẫn có thể thử một cái khác khi thí nghiệm đang chạy cơ mà.\r\nThu thập dữ liệu là một cách phổ biển để đạt được hiệu suất tốt hơn. Nếu việc lấy nhiều dữ liệu thật sự khó khăn, hãy tạo thêm công cụ để có thể thu thập, làm sạch và dán nhãn dữ liệu, bạn sẽ nó rất đáng để đầu tư đấy.\r\nHãy tham khảo ý kiến của các chuyên gia. Các chuyên gia trong lĩnh vực mà bạn đang tiếp cận thường có những cái nhìn cực kỳ hữu ích trong quá trình phân tích lỗi, trong khi đó các bài báo hay những người làm Học Máy kinh nghiệm sẽ cho bạn những hướng giải quyết khá sáng tạo, đáng để bạn thử đó.\r\nKĩ năng code là quan trọng, code đẹp có thể tránh được bugs. Tuy nhiên, trong quá trình thử bạn sẽ phải cắt xén code khá nhiều. Hãy thoải mãi với việc đó, bạn có thể “vệ sinh” code trước vòng lặp tiếp theo.\r\nNếu các thử nghiệm diễn ra quá lâu, bạn nên xem xét tối ưu code. Hãy nhờ đến sự giúp đỡ của một chuyên gia hệ thống để giúp bạn huấn luyện nhanh hơn. Nâng cấp GPU hay chạy nhiều thí nghiệm song song cũng là giải pháp thường thấy.\r\nKết luận\r\nNhư vậy, bài viết đã đưa ra một cách tiếp cận cho các dự án Học máy. Nếu như bạn cảm thấy mông lung và không biết bắt đầu từ đâu, hãy bắt đầu phân tích các lỗi, lên ý tưởng giải quyết, code chúng và xem nó hoạt động ra sao. Không ngừng tập trung vào chu trình trên một cách liên tục có thể đem đến những kết quả không ngờ trong cả nghiên cứu và ứng dụng đấy.', 2, NULL, 8),
(25, 'Những dự án hay ho giúp bạn nhanh chóng “chạm tay” tới đỉnh ', 'nhung-du-an-hay-ho-giup-ban-nhanh-chong-cham-tay-toi-dinh-lap-trinh', 'AI-Machine-Learning.jpg', 'Một người sau 1000 đào tạo mới lên được trình độ beginner, nhưng sau 10,000 ngày thực hành luyện tập mới lên được master.” Lý do vì sao?\r\n\r\nCâu nói nổi tiếng của Mas Oyama đủ để tóm tắt tất cả những gì tôi muốn nói trong bài này. Chìa khóa để trở thành một developer chuyên nghiệp nằm ở 2 từ: NỖ LỰC. Việc dành hàng giờ code chai lì trên bàn phím từng bước giúp bạn phát triển thành một developer thực thụ.\r\n\r\nSau đây là 7 dự án nhỏ thú vị bạn có thể thử sức giúp bạn nâng cao kĩ năng lập trình nhanh chóng.', '2022-03-23 05:39:48', 1, '2022-03-23 05:39:48', 'Dự án 1: Pac-man\r\n\r\nThử build game Pac-man là cách học nhanh nhất để hiểu rõ tường tận một game được build như thế nào. Bạn có thể build trên framework của JavaScript ví dụ như React hoặc Vue.\r\n\r\nNhững điều bạn có thể học được:\r\n\r\nChuyển động của các nhân vật \r\nDetect các key nào được nhấn \r\nDetect các va chạm\r\nBạn có thể nâng cấp bằng cách add thêm vào các chuyển động điều khiển cho các con ma trong game.\r\nBạn có thể tham khảo một vài dự án với GitHub tại đây.\r\n\r\n 43 kho lưu trữ Github JS phổ biến nhất - Bạn đã biết hết chưa?\r\nDự án 2: Quản trị người dùng\r\n\r\nTạo 1 ứng dụng CRUD để quản lý người dùng sẽ giúp bạn nhiều thứ về những nguyên tắc cơ bản của lập trình. Nó phù hợp với các dev mới bắt đầu biết và học về lập trình.\r\n\r\nBạn sẽ học được:\r\n\r\nCách routing\r\nXử lý các mẫu và phương thức thẩm định cơ sở dữ liệu người dùng đưa vào\r\nTương tác với cơ sở dữ liệu – tạo, đọc, cập nhật và xóa các action.\r\nXem thêm dự án tại đây.\r\n\r\nDự án 3: Cập nhật thời tiết theo địa điểm của bạn\r\n\r\nNếu bạn muốn bắt đầu build một app thì tạo app thời tiết sẽ là một điểm bắt đầu lý tưởng. Bạn có thể tạo bằng Swift.\r\n\r\nNgoài việc tích lũy được chút kinh nghiệm build app, bạn chắc chắn sẽ học hỏi thêm được:\r\n\r\nCách tương tác với một API\r\nCách sử dụng chức năng định vị địa lý\r\nBạn có thể khiến app của bạn trở nên sống động hơn bằng add thêm phần nhập text để người dùng nhập vị trí để xác định thời tiết tại vị trí của mình.\r\nMột API mà bạn có thể sử dụng để thu thập dữ liệu về thời tiết là OpenWeather API. Bạn có thể tìm thêm thông tin về OpenWeather API tại đây.\r\n\r\nDự án 4: Chat Box\r\n\r\nBuild một Chat Box là cách hay để tìm hiểu về socket. Bạn sẽ có nhiều lựa chọn về tech stalk để tiến hành. Node.js có thể là một lựa chọn tốt để bạn bắt đầu đấy.\r\n\r\nĐiều lớn nhất mà bạn học được từ dự án này đó là bạn sẽ biết được cách các socket hoạt động và cách ứng dụng chúng.\r\n\r\nNếu bạn chuyên lập trình Laravel và muốn thử làm việc với các socket, bạn có thể tham khảo bài viết này. Nó sẽ giúp bạn tìm hiểu sâu hơn cách ứng dụng một chat box trên bằng socket.\r\n\r\nDự án 5: GitLab Cl\r\n\r\nNếu bạn là một ma mới với CI (Continuous Intergration), bạn nên thử tìm tòi thêm về GitLab CI. Hãy thử lập ra nhiều môi trường và chạy thử trên đường truyền của bạn. Đây không phải là một chương trình quá “nặng”, nhưng tôi chắc là bạn sẽ học được nhiều thứ. Hiện nay nhiều team dev cũng sử dụng CI, và đây là công cụ tốt bạn nên trang bị cho bản thân.\r\n\r\nBạn sẽ học được những gì:\r\n\r\nHiểu biết về GitLab CI\r\nSử dụng hàm .gitlab-ci.yml để báo GitLab runner cần làm gì\r\nKhai thác các trường\r\nXem cụ thể hơn tại đây.\r\n\r\n Triển khai CI/CD với Gitlab\r\nDự án 6: Công cụ phân tích Website\r\n\r\nBạn có thể thử tạo một scraper giúp phân tích cách vận hành của website và tạo một ranking cho chúng. Lấy ví dụ, bạn có thể kiểm tra được những alt tag bị mất trên các hình và những meta tag của SEO có còn hiện trên trang không. Bạn thậm chí còn có thể áp dụng scraper mà không cần tạo 1 UI.\r\n\r\nBạn sẽ học được gì:\r\n\r\nCách làm việc của một scraper\r\nTạo các DOM selector\r\nCách viết thuật toán\r\nDự án 7: Khai thác xu hướng social media\r\n\r\nKhai thác xu hướng của social media là một cách tiếp cận với machine learning hiệu quả.\r\n\r\nBạn có thể bắt đầu bằng cách khai thác một platform mạng xã hội cụ thể nào đó, ví dụ như Twitter chẳng hạn.\r\n\r\nDev nhiều kinh nghiệm hơn thì có thể khai thác cùng lúc nhiều platform mạng xã hội và sau đó tổng hợp các dữ liệu đã thu thập lại.\r\n\r\nMày mò thực hiện với dự án này, bạn sẽ nắm được tổng quan về machine learning. Nghiên cứu kĩ hơn tại đây.\r\n\r\nKết luận: \r\nNhững dự án trên có thể sẽ tiêu tốn của bạn kha khá thời gian để hoàn thành. Đừng quên quay lại đây và chia sẻ về kết quả anh em thu được nhé.', 3, 55178, 8),
(26, '5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ c', '5-nguyen-nhan-chinh-tai-sao-cac-nha-khoa-hoc-du-lieu-roi-bo-cong-viec-cua-minh', 'AI-Machine-Learning.jpg', 'Hiện nay, biểu đồ của nhà khoa học dữ liệu đang ở mức đỉnh điểm. Hướng tới năm 2020, thực sự không có quá nhiều các chuyên gia ở ngoài kia có thể phân biệt trắng, đen hay tuân thủ các câu lệnh từ 1 nhà khoa học dữ liệu.', '2022-03-23 05:41:53', 1, '2022-03-23 05:41:53', 'Giới thiệu\r\n\r\nHiện nay, biểu đồ của nhà khoa học dữ liệu đang ở mức đỉnh điểm. Hướng tới năm 2020, thực sự không có quá nhiều các chuyên gia ở ngoài kia có thể phân biệt trắng, đen hay tuân thủ các câu lệnh từ 1 nhà khoa học dữ liệu.\r\n\r\nMình đã từng thấy mấy ông ‘không phải là khoa học gia dữ liệu’ (hay các gã ‘không phải là kĩ thuật viên’) nhìn vào 1 nhà khoa hc dữ liệu như là 1 siêu nhân. Có hàng tá các lý do cho việc này (gồm cả việc cường điệu quá theo truyền thông) nhưng không cần phải bận tâm vì công việc của 1 nhà khoa học dữ liệu là 1 việc làm cao quý.\r\n\r\nHãy xem thử biểu đồ ‘Hype Cycle’ được xuất bản bởi Gartner cho Artificial Intelligence năm 2019 bên dưới: \r\n\r\nNhững việc làm hấp dẫn\r\n\r\nSenior Java Engineer (Backend/Spring boot)\r\nNstepThành phố Hà Nội2,000 - 3,000 USD\r\nJavaBack-EndSpring Boot\r\n\r\nFULL-STACK DEVELOPER\r\nQST TechnologyThành phố Hà NộiUp to 1,500 USD\r\n.NETFull-StackReactJSVueJS.NET Core\r\n\r\n04 Ruby On Rails Developer (Up to $2000) ~ Sign-on Bonus\r\nNEOLAB VIET NAMThành phố Hồ Chí MinhUp to 2,000 USD\r\nCSSRuby on RailsHTML\r\n\r\n05 PHP Developers\r\nShopStack VietnamThành phố Hà NộiUp to 3,000 USD\r\nPHPCSSMagentoJavaScriptSQL\r\n\r\nMiddle Software Developer (C/C++; Embedded Linux/Android; Java)\r\nALTIMEDIAThành phố Hà NộiNegotiable\r\nLinuxAndroidJavaC/C++Embedded Engineer\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\nĐể ủng hộ, đây là “Báo cáo về các việc làm triển vọng của Linkedin” và mình chắc rằng bạn sẽ đoán ra ngay công việc đang đứng top danh sách là gì rồi:\r\n\r\n\r\nCác con số này khá là ngạc nhiên. Từ các công ty ‘Fortune 500’ tới các của hàng bán lẻ, tổ chức vòng quanh thế giới đều muốn xây dựng 1 đội hình bao gồm các chuyên gia khoa học dữ liệu hàng đầu. Năm 2019 vốn đã phá mọi kỉ lục trước đó của việc đầu tư vào ngành khoa học dữ liệu và AI.\r\n\r\nNhưng mặc dù có bao nhiêu xu hướng tích cực này, mình vẫn có 1 cảm giác không thoải mái tiềm ẩn. Các nhà khoa học dữ liệu đang từ bỏ hay đổi nghề 1 cách nhanh chóng. Tại sao điều này lại đang xảy ra? Liệu có điều gì mà chúng ta chưa biết?\r\n\r\nHãy phân tích 5 lý do chính tại sao các nhà khoa học dữ liệu lại đang rời bỏ công việc gần như là ước mơ của họ. Nếu như bạn cũng đang đối mặt với điều này, hay muốn chia sẻ kinh nghiệm riêng của mình, hãy chia sẻ nó với cộng đồng trong phần bình luận cuối bài nhé !\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\n\r\nKỳ vọng và Thực tế – Góc khuất to lớn !\r\nĐây là 1 trong những vấn đề phổ biến nhất trong lĩnh vực khoa học dữ liệu. Có 1 khuất mắt ngày càng lớn giữa việc các nhà khoa học dữ liệu mong đợi và việc họ thực sự làm trong ngành công nghiệp này.\r\n\r\nCó nhiều nguyên nhân cho điều này và có thể đa dạng tùy theo trường hợp của mỗi người. Các cấp độ về kinh nghiệm cũng đóng vai trò lớn trong vực sâu của sự kỳ vọng này.\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\n\r\nHãy lấy ví dụ về các nhà khoa học dữ liệu đầy tham vọng. Thông thường, họ tự học và thu thập kiến thức thông qua sách vở và các khóa học online. Họ không có cơ hội nhiều để tiếp xúc với các dự án ngoài đời thực hay là dataset. Mình cũng đã gặp khá nhiều ‘các nhà khoa học dữ liệu đầy tham vọng’, những người mà hầu như không biết tí gì về:\r\n\r\nCách 1 đường ống ‘machine learning’ hoạt động \r\nVai trò của kỹ thuật phần mềm trong kỹ năng tổng thể về khoa học máy tính \r\nViệc đặt 1 model vào khâu sản xuất/ triển khai 1 model có ý nghĩa như thế nào, v.. v..\r\nSự quan trọng của việc ‘dọn dẹp dữ liệu’ mà vốn nó đã ngốn khá nhiều thời gian của bạn\r\nCũng như tôi đã giới thiệu trước đó, cơ hội để chơi đùa với các bộ công cụ ‘machine learning hào nhoáng’ và các framework hiện đại nhất khá là quyến rũ cho các tân binh (và những người khác, thật sự!) \r\n\r\n“ Đây chính là thực tế – ngành công nghiệp này không hoạt động như thế. Có quá nhiều yếu tố để tạo ra một dự án khoa học dữ liệu gần với những gì chúng ta trải nghiệm trong các cuộc thi khoa học dữ liệu online.\r\n\r\nXem tiếp...\r\nLàm cách nào để bạn thu thập và lưu trữ dữ liệu, cách để chúng thực hiện ‘version control’, cách để triển khai model vào khâu sản xuất – đây chỉ là vài khía cạnh chính mà các tổ chức mong rằng bạn sẽ biết. \r\n\r\nSự mong đợi lệch lạc này là thứ cản đường chính và dẫn tới việc các nhà khoa học dữ liệu từ bỏ công việc của họ. Mình luôn luôn muốn khuyên các tân binh và các nhà khoa học dữ liệu nghiệp dư có thể trao đổi liên tục với các senior và các cựu sinh viên tổ chức của họ để xóa góc khuất giữa kỳ vọng và thực tế. \r\n\r\n2. Định hướng vai trò của các nhà khoa học dữ liệu tới mục đích kinh doanh\r\nĐây cũng là 1 trong những vấn đề ít phổ biến hơn. Điều này chủ yếu là do sự cường điệu quá mức về ngành khoa học máy tính và trí thông minh nhân tạo (AI) trong những năm gần đây.\r\n\r\nGiám đốc điều hành, CxO, C-Suite, nhà đầu tư – tất cả những người có tên tuổi trong giới kinh doanh của các doanh nghiệp đều muốn thể hiện rằng tổ chức hoặc dự án của họ luôn đi đầu trong những tiến bộ công nghệ mới nhất. Và AI ngay bây giờ chính là lĩnh vực để đầu tư.\r\n\r\nVấn đề là – chúng ta đã thấy hàng tá các ông senior tin rằng AI chính là mấu chốt cho các vấn đề kinh doanh của họ. Và nếu họ đầu tư vào AI cùng các chuyên gia phù hợp, họ sẽ tìm ra giải pháp nhanh hơn và tiết kiệm được 1 nửa thời gian. \r\n\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\nTuy nhiên, đó không phải là những gì sẽ diễn ra. Các dự án khoa học dữ liệu thông thường tương quan rất nhiều trải nghiệm, thử nghiệm, ‘error method’ và sự lặp đi lặp lại của cung 1 quá trình trước khi họ có thể với tới kết quả cuối cùng. Và đôi khi đòi hỏi hàng tháng trời để có thể đạt được kết quả mong muốn.\r\n\r\n” Data Warehouse và cơ sở hạ tầng AI đều yêu cầu khoản đầu tư khủng (tùy thuộc vào quy mô của công ty) và các khám phá trong công việc có thể mất khá lâu cũng như việc hình thành ‘insight’ hoạt động từ những vùng dữ liệu rộng lớn cũng thường ngốn nhiều thời gian. Đây cũng là lý do tại sao các nhà khoa học dữ liệu đòi hỏi sự tiếp cận linh hoạt – 1 nơi mà họ có thể cống hiến thời gian và không gian để làm việc trên dữ liệu.\r\n\r\nXem tiếp...\r\nĐiều này thường không đạt được thỏa thuận với các trưởng nhóm kinh doanh trong nhiều lĩnh vực. Các nhà khoa học dữ liệu cuối cùng cảm thấy khó chịu với khả năng lãnh đạo của các senior và những mong đợi không thực tế của bản thân, dẫn đến một cuộc di cư hàng loạt trong các dự án.\r\n\r\nLàm cách nào để các nhà khoa học dữ liệu và trưởng nhóm kinh doanh có thể làm việc hiệu quả:\r\n\r\nThiết lập sự liên lạc mật thiết giữa khoa học dữ liệu và các nhóm kinh doanh. Họ cần phải có sự gắn kết và phối hợp với nhau\r\nKhai thác trực giác kinh doanh và kiến thức từ các trưởng nhóm kinh doanh. Điều này có thể hoạt động 1 cách thần kỳ cho các nhà khoa học dữ liệu\r\nCùng phát triển 1 ma trận hiệu năng có thể đo đạc được cho kinh doanh để đo đạc sự tiến triển hiệu năng của các nhà khoa học dữ liệu\r\nSự linh hoạt đóng vai trò thiết yếu và là 1 trong những tố chất quan trọng cho 1 nhà khoa học dữ liệu\r\nTôi sẽ rất khuyến khích các chuyên gia khoa học dữ liệu và các trưởng nhóm kinh doanh xem thử series bên dưới của Tiến sĩ Om Deshmukh. Ông ta đã lập nên khuôn khổ cho việc vận hành thành công 1 dự án khoa học dữ liệu 1 cách rất chi tiết:\r\n\r\nA Data Science Leader’s Guide to Managing Stakeholders\r\nHow can you Convert a Business Problem into a Data Problem? A Successful Data Science Leader’s Guide\r\n4 Key Aspects of a Data Science Project Every Data Scientist and Leader Should Know\r\nDeployed your Machine Learning Model? Here’s What you Need to Know About Post-Production Monitoring\r\n3. Sự thiếu hụt việc nâng cao kĩ năng cho các chuyên gia khoa học dữ liệu \r\nAi mà không thích những thử thách mới? Tôi sẽ tranh luận rằng lĩnh vực khoa học dữ liệu sẽ chín muồi hơn nhờ những gì thử thách mang tới, như việc tạo nên tiến độ nhanh hơn, dẫn đến sự tiến bộ. Hãy chọn tên miền Natural Launguage Processing (NLP) chẳng hạn. Số lượng các tiến triển đã xảy ra trong vòng 2 năm qua thật sự rất ấn tượng. \r\n\r\nHầu hết các khoa học dữ liệu sẽ rất thích làm việc với những kỹ thuật và framework mới. Ý mình là, ai mà tận hưởng được việc dựng lên rồi cứ lặp đi lặp lại trên cùng model đệ quy logistic (logistic regression model) suốt mấy năm trời đây chứ?\r\n\r\n“ Vai trò của các nhà khoa học dữ liệu không tránh khỏi yếu tố trì trệ. Có 1 bức tường ngăn cản bạn sẽ gặp phải trong 1 thời điểm nhất định và cảm giác mong muốn các thử thách mới sẽ luôn sục sôi trong bạn. \r\n\r\nXem tiếp...\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\nHãy thêm điều này, về 2 yếu tố chúng ta đã nhắc ở trên về việc lo liệu các mong đợi. Đây là một sự pha trộn mọi thứ khá nhức nhói, phải không nào? Không thể tránh được viêc bất cứ nhân viên nào cũng sẽ chịu đựng sự thiếu động lực sau 1 thời điểm nhất định.\r\n\r\nĐiều này đặc biệt đúng tại các công ty lớn nơi độ linh hoạt thấp. Mình chắc rằng rất nhiều trong số các bạn đã trải nghiệm điều này, nhất là với những người đã làm việc tại các công ty ‘blue-chip. Các startup và doanh nghiệp cỡ vừa vẫn tốt hơn về vấn đề này (nhưng họ cũng đưa ra một loạt các thử thách khác nhau).\r\n\r\nCó 3 lý do chính mà mình đã gặp phải, vốn dẫn đến việc bào mòn nhân sự:\r\n\r\nSự thiếu hụt cơ sở hạ tầng: Đây là trường hợp phổ biến với hầu hết các doanh nghiệp, họ thiếu hụt cơ sở hạ tầng như hệ thống máy tính, độ tiếp cận tới các bộ công cụ v..v.. để hỗ trợ vai trò của 1 nhà khoa học dữ liệu\r\nPhạm vi kinh doanh: năng lực hoạt động của doanh nghiệp có thể hơi hạn chế và hạn hẹp. Tới 1 thời điểm, nó có thể gây khó khăn cho 1 nhà khoa học dữ liệu để suy luận nhiều insight hơn từ dữ liệu\r\nSự thiếu hụt nghiên cứu và phát triển: Là 1 nhà khoa học dữ liệu bạn sẽ thích khám phá nhiều lĩnh vực bên ngoài phạm vi công việc của bạn. Ví dụ: nếu bạn là 1 chuyên gia Thị giác Máy tính (Computer Vision) và muốn nghiên cứu thêm về NLP rồi tới vùng R&D sẽ là nơi tốt nhất cho bạn. Hầu hết các công ty điều thiếu sót điều này và dẫn đến việc hao hụt.\r\n4. Không có quy chuẩn rõ ràng trong các khoản chi trả lương\r\nÀ ha, mình có thể thấy ánh mắt chói lòa của bạn khi đọc tới tiêu đề này. Lương bổng là 1 trong những lý do chính khiến mọi người muốn nhảy vào ngành khoa học dữ liệu và làm việc như 1 sự nghiệp toàn thời gian.\r\n\r\nChúng ta thường thấy bảng các báo cáo từ McKinsey, Glassdoor v…v.. nơi họ giới thiệu mức lương trung bình cao vút dành cho các nhà khoa học dữ liệu. Hầu hết các tay mơ sẽ phải động lòng một khi thấy các con số được đưa ra trong các bảng báo cáo.\r\n\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\nLương của 1 nhà khoa học dữ liệu thì cao ngút trời. Mình đảm bảo rằng bạn đã đọc các bản tin trong năm nay. Và thấy các nhà khoa học dữ liệu hàng đầu đang được săn lùng bởi các công ty như Google và Apple (Ian Goodfellow là 1 ví dụ)\r\n\r\nĐiều này đang thường xuyên xảy ra. Các nhà khoa học dữ liệu, những người đang làm công việc đặc biệt trong lĩnh vực tương ứng của họ, thường được truy tìm bởi hơn 500 công ty Fortune, nơi đưa ra mức lương khá cao trong khi các công ty vừa và nhỏ thì lại không đưa ra được mức lương cao lắm (thường là vậy).\r\n\r\nMình cảm thấy đã đến lúc cần tiêu chuẩn hóa / quy chuẩn khi nhắc tới việc bù đắp xứng đáng. Ngay cả trong các công ty dạng vừa, nơi cần phân biệt rõ ràng khi so mức lương của 1 tân binh với kỹ năng cao đối với 1 nhà khoa học dữ liệu có kinh nghiệm với cùng cấp độ kỹ năng. Không quy chuẩn hóa mức lương có thể dẫn đến: \r\n\r\nKhông hài lòng, ảnh hưởng hiệu năng làm việc ngay cả đối với 1 nhân viên có tiềm năng cao\r\nNguyên nhân chính cho việc các nhân viên tiêm nhiễm nhau trong văn phòng, xem xét về các cơ hội làm việc tốt hơn ở các nơi khác\r\n1 lần nữa – khía cạnh này thật ra không khác nhiều so với các công việc khác, phải không nào? \r\n\r\n5. Tiếp xúc nhiều với các dự án khoa học dữ liệu khác nhau trên các nền tảng khác nhau\r\nBạn sẽ ước gì nhiều hơn giữa 2 sự lựa chọn này:\r\n\r\nLựa chọn 1: 1 công việc nhẹ – lương cao nơi bạn có thể điều chỉnh các kỹ năng và kết quả để đạt được các mục tiêu công ty, hay là\r\nLựa chon 2: 1 cuộc sống với công việc đầy linh hoạt nơi bạn có thể làm việc bất cứ đâu và đạt được sự tự trưởng thành cao?\r\nHầu hết các bạn đều chọn Lựa chọn 2. Ai mà không thích sự linh hoạt tại nơi làm việc và thoải mái tự chọn điều bạn muốn làm? \r\n\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\nNgày nay, có khá nhiều sự lựa chọn cho 1 nhà khoa học dữ liệu để lựa chọn:\r\n\r\nHọ có thể thử vận may của mình tại các cuộc thi trên các nền tảng như Kaggle, Analytics Vidhya v..v.. và thắng các khoản tiền thưởng thú vị và danh vọng trong cộng đồng\r\nCác freelancer được yêu cầu khá nhiều do những công ty ngày nay thường có hứng thú với các dự án ngắn hạn \r\nCác nhà khoa học dữ liệu freelance biết hầu hết về Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, TensorFlow, NLP, Computer Vision hay bất kỳ thứ gì của machine learning bởi vì họ phải nhảy vào các vấn đề và khám phá ra cách giải quyết nó\r\nViết blog và thương hiệu cá nhân cũng là sự lựa chọn đang khá ‘hot’ trong thời điểm này đối với các nhà khoa học dữ liệu. Chẳng hạn như là Grant Sanderson – ổng là 1 trong những người mà mình yêu thích !\r\nCác tổ chức thường không thể đề nghị hết những điều này cho các chuyên gia khoa học dữ liệu thường trực về các lý do logistic hiển nhiên hay những lý do liên quan tới dự án. \r\n\r\nLàm cách nào để các công ty có thể giữ được các Chuyên gia khoa học dữ liệu hàng đầu của mình?\r\n\r\n5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình\r\n\r\nĐây là 1 vài cách mình đã thử và kiểm nghiệm, thứ mà 1 doanh nghiệp có thể duy trì hầu hết các tài năng khoa học dữ liệu của mình:\r\n\r\nTạo ra 1 môi trường học tập mạnh mẽ: Đây là điều thiết yếu cho sự phát triển cá nhân và chuyên nghiệp hóa của 1 cá thể. Lĩnh vực này đang bùng phát với nhiều thứ mới mẻ để khám phá hơn mỗi ngày và với tốc độ này sẽ rất quan trọng để cung cấp một môi trường học tập tiến bộ cho các nhà khoa học dữ liệu\r\nXây dựng 1 đội ngũ Nghiên cứu và Phát triển mạnh mẽ: Tạo 1 đội ngũ R&D có thể tạo điều kiện cho việc nghiên cứu chất lượng và có thể thực hiện được trong lĩnh vực. Cho phép các nhân viên điều hướng nghiên cứu về các chủ đề chuyên sâu cũng là 1 công thức tuyệt vời\r\nTiêu chuẩn hóa sự bù đắp của họ: Tiêu chuẩn sự bù đắp sẽ chiếm từ từ được lòng tin và cho các nhà khoa học sự đảm bảo rằng họ đang được hưởng thù lao xứng đáng dựa vào các tiêu chuẩn tốt nhất của ngành công nghiệp này (cũng dễ hiểu thôi, điều này khá khó để thực hiện được)\r\nLời cuối\r\n\r\nMọi thứ về lĩnh vực khoa học dữ liệu đều rất là năng động. Chúng ta vẫn đang cố tìm hiểu rất nhiều thứ nên việc sắp đặt trên 1 khía cạnh hay 1 quá trình hay cấu trúc vẫn cho thấy nhiều sự khó khăn cho các doanh nghiệp.\r\n\r\nNgày qua ngày, mình tin rằng chúng ta sẽ có những hệ thống và tiến triển mạnh mẽ đúng lúc, và các nhà khoa học dữ liệu sẽ có 1 môi trường làm việc trọn vẹn. Quan điểm này cần phải thực hiện, cả từ quan điểm kinh doanh cũng như của các nhà khoa học dữ liệu\r\n\r\nMình cũng rất muốn nghe về các quan điểm của bạn về điều này. Không biết bạn có đang làm việc về các vấn đề khoa học dữ liệu không? Liệu bạn đã từng trải nghiệm bất cứ vấn đề nào mình đề cập ở trên không? Hay bất kỳ vấn đề nào khác mà bạn muốn chia sẻ? Hãy cho chúng mình biết ở phần ‘bình luận’ bên dưới nhé! ', 3, 17881, 8),
(27, 'Đánh giá chi tiết Samsung Galaxy A53 5G', 'danh-gia-samsung-galaxy-a53-5g-188699', 'danh-gia-galaxy-a53-5g-2-size-300x0-znd.jpg', 'Samsung Galaxy A53 5G vừa được ra mắt vào ngày 17/3/2022. Cùng đánh giá chi tiết chiếc điện thoại này cùng Quantrimang nhé.', '2022-03-23 13:44:22', 1, '2022-03-23 13:44:22', 'Đánh giá chi tiết Samsung Galaxy A53 5G\r\nThông số kỹ thuật\r\n\r\n<table style=\"border-collapse:collapse;width:94.0526%;height:342px\" border=\"1\"><tbody><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px;text-align:center\"><strong>Danh mục</strong></td><td style=\"width:62.8899%;height:23px;text-align:center\"><strong>Thông số kỹ thuật</strong></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Kích thước và trọng lượng</strong></td><td style=\"width:62.8899%;height:23px\">159.6 x 74.8 x 8.1 mm, 189g</td></tr><tr style=\"height:135px\"><td style=\"width:35.9727%;height:135px\"><strong>Màn hình</strong></td><td style=\"width:62.8899%;height:135px\"><p>Super AMOLED, 120Hz, tỷ lệ 20:9</p><p>6.5 inches, Full HD+ (1080 x 2400 pixels)</p><p>Corning Gorilla Glass 5</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Chipset</strong></td><td style=\"width:62.8899%;height:23px\"><p>Exynos 1280 5G (5 nm)</p><p>8 nhân (2x2.4 GHz & 6x2.0 GHz)</p><p>GPU: Mali-G68</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Bộ nhớ</strong></td><td style=\"width:62.8899%;height:23px\"><p>RAM: 6-8GB</p><p>ROM: 128-256GB</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Camera sau</strong></td><td style=\"width:62.8899%;height:23px\"><p>64 MP, f/1.8 (góc rộng), PDAF, OIS</p><p>12 MP, f/2.2, 123˚ (góc siêu rộng)</p><p>5 MP, f/2.4 (macro)</p><p>5 MP, f/2.4 (đo chiều sâu)</p><p>Quay phim: 4K@30fps, 1080p@30/60fps; gyro-EIS</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Camera trước</strong></td><td style=\"width:62.8899%;height:23px\"><p>32 MP, f/2.2 (góc rộng)</p><p>Quay phim: 4K@30fps, 1080p@30fps</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Pin</strong></td><td style=\"width:62.8899%;height:23px\"><p>Li-Po 5000 mAh</p><p>Sạc nhanh 25W</p></td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Hệ điều hành</strong></td><td style=\"width:62.8899%;height:23px\">Android 12, One UI 4</td></tr><tr style=\"height:23px\"><td style=\"width:35.9727%;height:23px\"><strong>Tính năng khác</strong></td><td style=\"width:62.8899%;height:23px\">IP67, loa kép stereo, hỗ trợ thẻ nhớ ngoài, vân tay quang học dưới màn hình, bluetooth 5.1</td></tr></tbody></table>\r\n\r\nTính năng khác IP67, loa kép stereo, hỗ trợ thẻ nhớ ngoài, vân tay quang học dưới màn hình, bluetooth 5.1\r\nGalaxy A53 5G là chiếc điện thoại mới nhất tới từ Samsung\r\n\r\n \r\nThiết kế tương tự dòng sản phẩm cao cấp\r\nGalaxy A53 có thiết kế mặt lưng tương tự với sản phẩm đàn anh - Galaxy A52 với cụm camera hình chữ nhật cùng với 4 ống kính và đèn flash.\r\n\r\nTuy nhiên về kiểu dáng thì Galaxy A53 có phần giống với dòng Galaxy S22. Nó được trang bị khung viền bằng nhựa, mạ bóng giả kim loại. Thiết kế của Galaxy A53 tạo cảm giác trẻ trung nhưng cũng không kém phần sang trọng khi 4 cạnh hơi được bo nhẹ, tuy nhiên tổng thể vẫn tương đối vuông vức, lịch sự.\r\n\r\nPhần vỏ máy được làm từ nhựa nên máy chỉ nặng 189g, tương đối nhẹ, tạo cảm giác thoải mái, cầm nắm chắc tay. Bên cạnh đó việc có tới 4 màu sắc: đen, trắng, xanh, đào giúp người dùng có thể thoải mái trong việc lựa chọn theo sở thích bản thân.\r\n\r\nGalaxy A53 5G có 4 màu giúp người dùng có thể thoải mái lựa chọn\r\n\r\n \r\nTrang bị màn hình Super AMOLED 120Hz\r\nSản phẩm mới nhất tới từ Samsung được trang bị màn hình 6.5 inch cùng với tấm nền Super AMOLED cho hình ảnh tươi sáng, nịnh mắt. Màn hình của Samsung Galaxy A53 5G còn có độ phân giải Full HD+ cùng mật độ điểm ảnh lên tới 405PPI giúp hình ảnh hiển thị được sắc nét tới từng chi tiết.\r\n\r\nGalaxy A53 5G được trang bị màn hình 6.5 inch cùng với tấm nền Super AMOLED \r\nBên cạnh đó Samsung còn trang bị cho dòng sản phẩm này của mình kính cường lực Corning Gorilla Glass 5 bền bỉ, bảo vệ phần màn hình được hiệu quả hơn. Đồng thời hệ thống cảm biến vân tay quang học ở trong màn hình giúp gia tăng tính năng bảo mật, tốc độ mở khóa nhanh và nhạy hơn so với thông thường.\r\n\r\nCụm camera hỗ trợ quay phim 4K\r\nSamsung Galaxy A53 5G có bộ 4 camera với mỗi camera lại có nhiệm vụ khác nhau. Trong đó ống kính chính 64MP có chế độ chụp ảnh góc rộng đi kèm với chống rung quang học OIS. Ngoài ra còn có một ống kính góc siêu rộng 12MP, 2 cảm biến 5MP đảm nhiệm chụp ảnh cận cảnh macro và đo độ sâu của ảnh. Bộ 4 camera này đã tạo nên một hệ thống camera cho ra những bức hình tuyệt vời sống động nhất cho người dùng.\r\n\r\n\r\n \r\nNgoài được trang bị cụm camera sau cực khủng ra thì camera trước của Galaxy A53 cũng có 32MP góc rộng đi kèm với các tính năng như làm đẹp bằng AI, chụp xóa phông, HDR...\r\n\r\nA53 được trang bị camera trước và sau cực khủng\r\nTính năng đặc biệt của chiếc điện thoại này cần để cập tới chính là khả năng quay video lên tới 4K cả ở camera trước và sau. Chất lượng video cực kỳ sắc nét, màu sắc tươi sáng. Không chỉ vậy việc quay phim, chụp ảnh bằng trong điều kiện thiếu sáng, buổi đêm cũng không là trở ngại với chiếc điện thoại này.\r\n\r\nSở hữu con chip có hiệu năng mạnh mẽ\r\nGalaxy A53 sở hữu con chip Exynos 1280 5G. Đây là con chip sản xuất trên tiến trình 5nm giúp tiết kiệm điện năng cũng như tối ưu hóa tốt One UI 4.1. Do đó Galaxy A53 có thời lượng sử dụng lâu hơn so với các thế hệ tiền nhiệm.\r\n\r\nExynos 1280 5G còn là con chip do chính Samsung sản xuất với 8 nhân gồm có 2 tốc độ cao 2.4 GHz và 6 nhân tiết kiệm điện xung nhịp thấp 2.0 GHz. Điều này khiến cho hiệu năng của chiếc điện thoại Galaxy A53 là vô cùng mượt mà với các tác vụ thông thường.\r\n\r\nExynos 1280 5G còn là con chip do chính Samsung sản xuất\r\n\r\n \r\nDung lượng pin khủng lên tới 5000mAh\r\nSamsung đã trang bị cho Galaxy A53 dung lượng pin thuộc hàng khủng - 5000mAh, cộng thêm bộ vi xử lý tiết kiệm điện năng khiến cho chiếc điện thoại này cho phép người dùng có thể sử dụng thoải mái suốt cả 1 ngày dài.\r\n\r\nDung lượng pin của A53 lên tới 5000mAh\r\nCùng với đó A53 còn được tích hợp chế độ sạc nhanh 25W tương đương với chiếc điện thoại Samsung Galaxy S22.\r\n\r\nMẹo duy trì dung lượng pin smartphone ở trạng thái tốt nhất\r\nCách kiểm tra pin smartphone Android, kiểm tra tuổi thọ pin\r\nCách sạc pin điện thoại đúng chuẩn\r\n11 mẹo tiết kiệm pin tối đa cho điện thoại\r\nMức giá bán Samsung Galaxy A53 5G\r\nSamsung Galaxy A53 5G chính hãng được bán tại Việt Nam với mức giá khoảng dưới 10 triệu đồng đối với phiên bản 8GB/128GB. Đây là một mức giá ổn khi chiếc điện thoại này được trang bị rất nhiều tính năng nổi trội.\r\n\r\nMức giá bán A53 tại Việt Nam được cho là khá hợp lý.\r\nTop 6 điện thoại dùng chip Snapdragon 888 rẻ nhất năm 2022\r\nTop 6 điện thoại giá rẻ bán chạy nhất\r\nTổng kết đánh giá Samsung Galaxy A53 5G\r\nNhững ưu điểm của Galaxy A53\r\nTổng kết lại A53 có những ưu điểm sau:\r\n\r\nDung lượng pin trâu, thời gian sử dụng được dự đoán lên tới 1 ngày.\r\nMàn hình có tần số quét 120Hz cho hình ảnh sắc nét, mượt mà.\r\nCamera hỗ trợ quay 4K cho ra chất lượng video sống động.\r\nVân tay quang học dưới màn hình giúp nâng cao tính bảo mật.\r\n\r\n \r\nGalaxy A53 có rất nhiều ưu điểm nổi trội\r\nNgoài những đặc điểm nói trên thì Samsung Galaxy A53 5G còn có một số tính năng khác giúp nâng cao trải nghiệm người dùng. Bao gồm:\r\n\r\nHỗ trợ kết nối 5G, gia tăng tốc độ kết nối internet.\r\nKhả năng kháng nước, kháng bụi IP67.\r\nHệ thống loa kép stereo nâng cao trải nghiệm về mặt âm thanh cho người dùng.\r\nA53 vẫn còn một số nhược điểm nhất định\r\nDòng sản phẩm Galaxy chạy con chip Exynos vốn không được đánh giá cao về khả năng chơi game, và A53 cũng gặp tình trạng tương tự. Vậy nên đối với người dùng muốn trải nghiệm tốt trong việc chơi game thì cần cân nhắc trước khi mua chiếc điện thoại này.\r\n\r\nTop điện thoại chơi game tốt nhất 2022\r\nAsus ROG Phone 3: Diệt gọn các smartphone chơi game\r\nNgoài ra A53 cũng không được trang bị jack cắm tai nghe 3.5mm cũng như không có củ sạc đi kèm với máy.\r\n\r\nGalaxy A53 không có jack cắm 3.5 cũng như không có bộ sạc đi kèm\r\nThông qua bài đánh giá chi tiết Samsung Galaxy A53 5G này của Quantrimang chắc hẳn rằng bạn cũng đã nắm được ưu điểm cũng như nhược điểm của chiếc điện thoại mới tới từ Samsung này. Nếu như bạn đang mong muốn sở hữu một chiếc điện thoại có camera khủng, pin trâu cũng như hiệu năng ổn định, có mức giá dưới 10 triệu thì A53 cũng là một lựa chọn vô cùng đáng cân nhắc.', 2, 10, 11),
(28, 'Cách làm bò sốt vang mềm, ngon tuyệt', 'cach-lam-bo-sot-vang-mem-ngon-tuyet', 'thit-bo-sot-vang-700-size-696x364-znd.jpg', 'Bò sốt vang là một món ăn gần gũi, quen thuộc cực phù hợp với tiết trời se lạnh. Bài viết dưới đây sẽ hướng dẫn bạn làm món bò sốt vang mềm ngon, đậm đà khiến bữa cơm gia đình trở nên vô cùng ấm áp và ngon miệng.', '2022-03-23 16:49:08', 1, '2022-03-23 16:49:08', 'Cách chọn thịt bò nấu sốt vang\r\nPhần thịt phù hợp nhất cho bò sốt vang là nạm bò có nhiều gân, thịt mềm lại giòn, không bị khô sau khi ninh.\r\n\r\nNguyên liệu nấu bò sốt vang\r\nGia vị ướp thịt bò:\r\n\r\n1 thìa tỏi băm\r\n1 thìa cà phê ngũ vị hương\r\n1 thìa cà phê đường\r\n½ thìa cà phê hạt nêm nấm củ quả\r\n4 thìa canh rượu vang đỏ\r\nNguyên liệu bò sốt vang:\r\n\r\nThịt bò nạm sườn: 500g\r\n3 củ khoai tây\r\n1 củ cà rốt\r\n1/2 củ hành tây\r\n1 quả cà chua\r\nRau mùi tàu\r\n1 nhánh gừng đập dập\r\n2 thìa canh sốt cà chua cô đặc\r\n2 thìa canh bơ lạt\r\n4 thìa canh rượu vang đỏ\r\n1l nước\r\n1 thìa canh hạt nêm nấm củ quả\r\n1/2 thìa cà phê muối\r\n1/2 thìa canh đường\r\n1 thìa cà phê hạt tiêu sọ\r\n2 thìa canh dầu ăn\r\n\r\nCách nấu thịt bò sốt vang\r\nThịt bò mua về rửa sạch với nước.\r\nĐun nước sôi, cho ít gừng đập dập vào nồi. Cho thịt bò vào chần sơ qua.\r\nThái thịt bò thành những miếng vuông nhỏ 3cm x 3cm.\r\nThái thịt bò kho\r\n\r\nCho thịt vào bát to, rồi cho thêm tỏi băm, ngũ vị hương, đường, hạt nêm, rượu vang đỏ và trộn đều, ướp trong khoảng 20 phút.\r\nKhoai tây, cà rốt gọt vỏ, rửa sạch rồi cắt thành các khối vừa ăn.\r\nCà chua rửa sạch, cắt hình múi cau. Hành tây bỏ vỏ, rửa sạch thái hạt lựu nhỏ.\r\nRau mùi tàu bỏ rễ, rửa sạch, cắt khúc khoảng 2cm.\r\nCho nồi áp suất lên bếp và bật lửa. Khi nồi nóng, cho dầu ăn vào. Sau đó, cho hành tây vào phi thơm. Cho tiếp cà chua và sốt cà chua cô đặc vào xào chín. Tiếp theo cho bơ vào đảo đều.\r\nCho thịt bò đã ướp vào nồi cùng với 4 thìa canh rượu vang đỏ và đảo cho thịt săn lại.\r\nCuối cùng cho nước vào, đậy nắp nồi áp suất và đun ở lửa lớn khoảng 7 phút.\r\nMở nắp nồi áp suất cho thêm hạt nêm, muối, đường, hạt tiêu sọ vừa ăn. Cho khoai tây, cà rốt vào nồi, và đun tiếp đến khi tất cả nguyên liệu chín mềm là được.\r\nKhi thịt bò chín, cho rau mùi tàu vào nồi và múc ra bát thưởng thức.\r\n\r\nThịt bò sốt vang mềm lại giòn, không bị khô, rất hấp dẫn.\r\n\r\nNgoài thịt bò sốt vang, các bạn có thể dùng thịt bò để chế biến nhiều món ngon khác như thịt bò xào, thịt bò kho...', 3, 0, 1);
INSERT INTO `post` (`post_id`, `post_title`, `slug`, `thumbnail`, `summary`, `updatedAt`, `published`, `publishedAt`, `content`, `user_id`, `viewcount`, `category_id`) VALUES
(29, '3 cách làm xoài lắc cực ngon và đơn giản', 'cach-lam-xoai-lac', 'xoai-lac-2.jpg', 'Bài viết dưới đây sẽ giới thiệu với các bạn 3 cách làm xoài lắc tại nhà đơn giản nhưng cực kỳ ngon, mời các bạn tham khảo.', '2022-03-23 16:51:07', 1, '2022-03-23 16:51:07', 'Cách làm xoài lắc chua ngọt\r\nNguyên liệu\r\n\r\nXoài keo: 1 trái\r\nỚt: 1 trái\r\nMuối tôm:1 muỗng canh (hoặc muối Tây Ninh)\r\nNước mắm: 5 muỗng canh\r\nĐường: 3 muỗng canh\r\nCách làm\r\n\r\nXoài rửa sạch, gọt bỏ vỏ rồi cắt thành khúc vừa ăn\r\nỚt rửa sạch, ăm nhỏ.\r\nCho chảo lên bếp, cho vào 5 muỗng canh nước mắm vào. Khi nước mắm sôi, cho tiếp 3 muỗng đường vào và khuấy đều để đường tan hoàn toàn.\r\nTiếp tục cho thêm ướt và đun cho đến khi nước mắm sệt lại, khoảng 2 phút thì tắt bếp, để nguội.\r\nCho xoài đã thái vào hộp có nắp, rắc 1 muỗng canh muối tôm và cho hỗn hợp nước mắm đã nguội vào. Đậy nắp hộp và lắc đều để xoài thấm gia vị là được.\r\nCách làm xoài lắc Thái Lan\r\nNguyên liệu\r\n\r\n2 quả xoài Thái xanh\r\n1 thìa cà phê muối tôm\r\n1 thìa cà phê nước mắm\r\n1 quả ớt cắt lát\r\n2 thìa cà phê đường\r\nCách làm\r\n\r\nRửa sạch, gọt bỏ vỏ xoài, và cắt thành các miếng vuông vừa ăn.\r\nBạn cho xoài cùng với đường, muối ớt, nước mắm và ớt vào hộp rồi lắc đều khoảng 30 giây.\r\nCho xoài vào ngăn mát tủ lạnh khoảng 1 tiếng cho xoài ngấm gia vị là bạn đã có món xoài lắc Thái Lan cực ngon để thưởng thức rồi.\r\n\r\nCách làm xoài lắc muối tôm\r\nNguyên liệu\r\n\r\n3 quả xoài keo\r\nNước mắm\r\nNước lọc\r\nĐường\r\nỚt bột\r\nỚt sừng\r\nỚt khô xay\r\nTỏi\r\nTôm khô\r\nMuối bột canh\r\nCách làm\r\n\r\nRửa xoài, gọt vỏ và thái thành miếng vừa ăn. Cho xoài vào ngâm trong nước đá khoảng 10 phút rồi vớt ra để ráo nước.\r\nBắc nồi lên bếp rồi cho vào 1 thìa canh đường, 1 thìa canh mắm và đun với lửa vừa. Vừa đun vừa đảo để đường tan ra. Khi nước mắm sôi thì tắt bếp và để nguội.\r\nCho xoài và hỗn hợp nước mắm đường đã nguội và ngâm khoảng 1 tiếng.\r\nTôm khô ngâm nước ấm khoảng 10 phút rồi vớt ra để cho ráo nước. Cho tôm khô, ớt sừng, tỏi, muối, ớt khô vào máy xay sinh tố và xay nhuyễn.\r\nCho hỗn hợp vừa xay vào chảo, đảo đều và đun ở lửa nhỏ. Đun đến khi muối khô thì tắt bếp để nguội.\r\nCho muối tôm và hộp xoài đã ngấm gia vị và lắc đều là được.\r\n\r\nVị chua, ngọt, mặn và cay hòa quyện một cách hài hòa khiến món xoài lắc trở nên cực kỳ hấp dẫn và ngon miệng. Chúc các bạn thành công.', 3, 0, 1),
(30, 'Cách làm quất chưng đường phèn tốt cho sức khỏe', 'cach-lam-quat-chung-duong-phen', 'quat-chung-duong-phen-1-size-696x364-znd.jpg', NULL, '2022-03-23 16:53:03', 0, '2022-03-23 16:53:03', 'Quất chưng đường phèn là vị thuốc dân gian vô cùng quen thuộc với người dân ta từ xưa, với những vị thuốc cổ truyền. Quất có tác dụng trị ho từ xưa, giải đờm hiệu quả. Khi kết hợp quất với đường phèn sẽ giúp hạn chế được tình trạng đau họng, nhất trong thời gian chuyển mùa. Dưới đây là công thức của món quất chưng đường phèn.\r\n\r\nNguyên liệu\r\nQuất 500g\r\nĐường phèn 200g\r\nNước lọc 150ml\r\nCác bước thực hiện : Cách làm quất chưng đường phèn tốt cho sức khỏe\r\nBước 1: Rửa sạch quất\r\n?️\r\nChà xát quất với muối để loại bỏ những cặn bẩn còn sót lại trên vỏ quất. Sau đó ngâm quất trong nước muối khoảng 10 phút rồi vớt ra, rửa lại bằng nước và để ráo.\r\n\r\nBước 2: Thái lát quất\r\n?️\r\nThái quất thành từng lát vừa phải, không quá mỏng, không bỏ hạt quất vì hạt quất có tính năng giảm ho. Nếu nhà có trẻ nhỏ thì bạn có thể vắt quất lấy nước rồi cắt nhỏ xác quả.\r\n\r\nBước 3: Chưng quất đường phèn\r\n?️\r\nChuẩn bị nồi nhỏ rồi cho quất vào nồi, đường phèn, nước lọc và đun sôi trên lửa vừa. Khi hỗn hợp sôi thì chuyển dần sang lửa nhỏ và đun từ từ để thành hỗn hợp đặc. Dùng đũa khuấy liên tục để tránh bị cháy. Khi quất mềm, sánh và quánh lại thì tắt bếp.\r\n\r\nĐể nguội hỗn hợp, khi còn ấm thì cho tiếp lượng nhỏ mật ong và trộn đều. Chờ quất nguội hẳn thì cho vào lọ đậy kín và dùng dần.\r\n\r\nBạn cũng có thể dùng làm mứt phết bánh mì cũng rất ngon.', 2, 0, 1),
(31, 'Hướng dẫn làm bánh ngô chiên không dầu mỡ', 'huong-dan-lam-banh-ngo-chien', 'lam-banh-ngo-chien-700-size-300x0-znd.jpg', NULL, '2022-03-23 16:54:34', 1, '2022-03-23 16:54:34', 'Bánh ngô chiên thì không lạ với mọi người nhưng có rất nhiều chị em e ngại về mức độ dầu ăn ngấm trong bánh khi thực hiện theo công thức và cách làm truyền thống. Nếu vậy thì bạn có thể làm theo công thức trong bài viết dưới đây, hạn chế dùng dầu ăn tối đa nhất mà bánh vẫn có được độ giòn ngon của bánh.\r\n\r\nNguyên liệu\r\nNgô ngọt 1 bắp\r\nTinh bột ngô 2 thìa canh\r\nBột gạo nếp 2 thìa canh\r\nBột gạo nếp 2 thìa canh\r\nCác bước thực hiện : Hướng dẫn làm bánh ngô chiên không dầu mỡ\r\nBước 1: Sơ chế ngô\r\n<img class=\"lazy loaded lightbox\" data-src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-1-size-696x364-znd.jpg\" src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-1-size-696x364-znd.jpg\" alt=\"?️\" data-was-processed=\"true\" data-i=\"0\">\r\nTách hạt ngô sau đó rửa sạch và chần ngô trong nước sôi khoảng 1 phút rồi để ráo nước.\r\n\r\nBước 2: Trộn bột với ngô\r\n<img class=\"lazy lightbox loaded\" data-src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-2-size-696x364-znd.jpg\" src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-2-size-696x364-znd.jpg\" alt=\"?️\" data-i=\"1\" data-was-processed=\"true\">\r\nCho ngô vào bát rồi cho thêm tinh bột ngô, bột gạo nếp, đường vào và trộn đều. Nếu không ăn ngọt thì bạn có thể giảm lượng đường. Nếu thấy ngô hơi khô thì có thể thêm chút sữa tươi để bột tan hết.\r\n\r\nBước 3: Chiên bánh ngô\r\n<img class=\"lazy lightbox loaded\" data-src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-3-size-696x364-znd.jpg\" src=\"https://st.quantrimang.com/photos/image/2022/03/06/lam-banh-ngo-chien-3-size-696x364-znd.jpg\" alt=\"?️\" data-i=\"2\" data-was-processed=\"true\">\r\nQuét một lớp mỏng dầu ăn vào chảo hoặc khay làm bánh nếu bạn có, rồi cho từng muỗng bánh ngô đã trộn đều. Lưu ý bạn chỉ nên xúc từng muỗng bánh vừa phải, không nên xúc nhiều. Dàn mỏng lớp bánh và nén chặt để tạo thành khuôn. Rắc thêm chút vừng đen lên bề mặt rồi rán đều 2 mặt. Chiên bánh với lửa nhỏ để đảm bảo bánh không bị cháy.', 2, 0, 2),
(32, 'Win 11', 'win-11', 'win-11.jpg', 'Đang viết', '2022-04-05 16:53:05', 1, '2022-04-05 16:53:05', 'Đang viết', 2, 1, 6),
(33, 'Demo', 'demo', 'Florentino.jpg', 'Đang viết ...', '2022-04-05 00:00:00', 1, '2022-04-05 00:00:00', 'Đang viết ... chưa nghĩ ra gì để viết', 2, 2, 6),
(34, 'Demo2', 'Demo2', 'Florentino.jpg', 'Äang viết', '2022-04-05 00:00:00', 1, '2022-04-05 00:00:00', 'Äang viết', 3, 2, 6),
(35, 'Demo3', 'Demo3', 'win-11.jpg', 'Äang viết ...', '2022-04-05 00:00:00', 1, '2022-04-05 00:00:00', 'Äang viết ... chÆ°a nghÄ© ra gì Äá» viết', 8, 8, 8),
(36, 'Test1', 'test', 'file-md-la-gi-size.jpg', 'file-md-la-gi-size.jpg', '2022-04-11 00:00:00', 1, '2022-04-05 00:00:00', '6', 9, 12, 6),
(41, 'Test2', 'test2', 'sharingan.jpg', 'Äang viết ...', '2022-04-16 00:00:00', 1, '2022-04-16 00:00:00', 'Äang viết ... chÆ°a nghÄ© ra gì Äá» viết', 2, 0, 14),
(42, 'Test3', 'test3', 'sharingan.jpg', 'Äang viết ...', '2022-04-17 00:00:00', 1, '2022-04-17 00:00:00', 'Äang viết ... chÆ°a nghÄ© ra gì Äá» viết', 3, 10, 14),
(43, 'Test4', 'test4', 'sharingan.jpg', 'Äang viết ...', '2022-04-18 00:00:00', 1, '2022-04-18 00:00:00', 'Äang viết ... chÆ°a nghÄ© ra gì Äá» viết', 2, 10, 14),
(44, 'Test5', 'test5', 'sharingan.jpg', 'Äang viết ...', '2022-04-19 00:00:00', 1, '2022-04-19 00:00:00', 'Äang viết ... chÆ°a nghÄ© ra gì Äá» viết', 2, 3, 14),
(45, 'Test6', 'test6', 'sharingan.jpg', 'Đang viết ...', '2022-04-16 00:00:00', 1, '2022-05-02 00:00:00', '<p>Đang nghĩ gì để viết</p>\r\n', 2, 0, 14);
--
-- Chỉ mục cho các bảng đã đổ
--
--
-- Chỉ mục cho bảng `post`
--
ALTER TABLE `post`
ADD PRIMARY KEY (`post_id`),
ADD KEY `user_id` (`user_id`),
ADD KEY `category_id` (`category_id`);
--
-- AUTO_INCREMENT cho các bảng đã đổ
--
--
-- AUTO_INCREMENT cho bảng `post`
--
ALTER TABLE `post`
MODIFY `post_id` bigint(20) NOT NULL AUTO_INCREMENT, AUTO_INCREMENT=46;
--
-- Các ràng buộc cho các bảng đã đổ
--
--
-- Các ràng buộc cho bảng `post`
--
ALTER TABLE `post`
ADD CONSTRAINT `post_ibfk_3` FOREIGN KEY (`user_id`) REFERENCES `user` (`user_id`) ON DELETE CASCADE ON UPDATE CASCADE,
ADD CONSTRAINT `post_ibfk_4` FOREIGN KEY (`category_id`) REFERENCES `category` (`category_id`) ON DELETE NO ACTION ON UPDATE NO ACTION;
COMMIT;
/*!40101 SET CHARACTER_SET_CLIENT=@OLD_CHARACTER_SET_CLIENT */;
/*!40101 SET CHARACTER_SET_RESULTS=@OLD_CHARACTER_SET_RESULTS */;
/*!40101 SET COLLATION_CONNECTION=@OLD_COLLATION_CONNECTION */;