ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT
-ChatGPT là gì?
-Cách tạo tài khoản ChatGPT
-Cách tạo tài khoản ChatGPT ở Việt Nam
-Cách sử dụng ChatGPT
-ChatGPT có được dùng miễn phí không?
-Hạn chế của ChatGPT là gì?
-Ưu điểm của ChatGPT là gì?
-ChatGPT được tạo ra như thế nào?
-Cơ sở kiến thức của ChatGPT là gì?
Vào những ngày cuối năm 2022, ChatGPT đã tạo ra khá nhiều bất ngờ cho cộng đồng công nghệ. Bài viết này giới thiệu ChatGPT là gì? Và tất cả thông tin quan trọng cần biết về ChatGPT.
ChatGPT là gì?
ChatGPT là một chatbot được tạo ra bởi tổ chức OpenAI. ChatGPT có khả năng trả lời hay phản hồi lại với bất kỳ nội dung nào nhập vào từ người dùng. Tuỳ theo nội dung bạn nhập vào, mà ChatGPT sẽ có những đoạn trả lời tương ứng.
Ví dụ nếu bạn nhập vào 1 đoạn dữ liệu ‘random’ (ngẫu nhiên), không có ý nghĩa, thì câu trả lời bạn nhận được sẽ là: “Tôi xin lỗi, nhưng có vẻ như bạn chỉ đang gõ các chữ cái ngẫu nhiên. Có bất cứ điều gì cụ thể mà bạn muốn biết hoặc nói về? Tôi sẽ cố gắng hết sức để giúp bạn giải đáp mọi thắc mắc.”
Khi bạn truy cập vào trang web chính thức của OpenAI và ChatGPT thì bạn sẽ bắt gặp đoạn giới thiệu này: “ChatGPT: Optimizing Language Models for Dialogue”; điều này có nghĩa là ChatGPT được tạo ra bằng cách tối ưu các mô hình ngôn ngữ, nhưng có mục tiêu rõ ràng là dành cho đối thoại (dialogue).
Hình ảnh giới thiệu ChatGPT.
Để biết thêm chi tiết về việc ChatGPT được tạo ra như thế nào? Và các cơ sở kiến thức của ChatGPT là gì? Cũng như mô hình ngôn ngữ là gì? Bạn xem thêm ở các phần bên dưới.
Cách tạo tài khoản ChatGPT
Để tạo tài khoản ChatGPT, bạn vào trang web Login của ChatGPT với đường dẫn sau đây: https://chat.openai.com/auth/login.
Sau đó, bạn thực hiện các bước sau:
Bước 1: Bấm vào Sign up (có nghĩa là đăng ký), nếu bạn chưa có tài khoản.
Bước 2: Điền vào email của bạn ở ô ‘Email address’ hoặc chọn ‘Continue with Google’ (có nghĩa là bạn sẽ sử dụng tài khoản Email hiện đang đăng nhập trên Google để đăng ký tài khoản cho ChatGPT). Ví dụ ở đây mình chọn ‘Continue with Google’.
Bước 3: Một giao diện ‘Sign in with Google’ hiện ra, lúc này bạn chọn vào tài khoản Email của bạn.
Bước 4: Điền vào số điện thoại và bấm vào ‘Send code’. Sau đó, ứng dụng ChatGPT sẽ gửi một mã xác nhận gồm 6 số vào số điện thoại của bạn. Bạn tiến hành điền mã xác nhận này vào giao diện hiện ra.
Nếu bạn tạo tài khoản ChatGPT thành công, thì màn hình chat
Cách tạo tài khoản ChatGPT ở Việt Nam
Trong trường hợp, nếu bạn ở Việt Nam và không thể truy cập vào đường link của trang GPT, bạn có thể sử dụng VPN để chuyển địa chỉ IP của bạn sang một địa chỉ IP ở những nước có thể truy cập vào trang web của ChatGPT, ví dụ như Mỹ hay Nhật.
Sau đây là 1 bài viết giới thiệu về 7 nhà cung cấp VPN miễn phí hàng đầu năm 2023.
Sau khi chuyển địa chỉ IP thành công, bạn làm theo các bước bên trên để tạo tài khoản ChatGPT.
ChatGPT cần số điện thoại để xác nhận, trong trường hợp này, bạn có thể sử dụng công cụ smspool.net để sử dụng tạm thời một số điện thoại để lấy mã xác nhận.
Cách sử dụng ChatGPT
ChatGPT có thể được xem như là một chatbot, nên bạn có thể hỏi ChatGPT bất kỳ câu hỏi nào. Vì ChatGPT chưa được huấn luyện để trả lời các câu hỏi về tin tức, nên khi bạn hỏi về vấn đề tin tức, thì ChatGPT có thể sẽ không trả lời được.
Sau đây là một số khả năng ấn tượng mà ChatGPT làm được:
Viết chương trình theo yêu cầu
Tìm lỗi trong chương trình và hướng dẫn cách sửa lỗi
Phát hiện lỗ hổng bảo mật
ChatGPT của OpenAI sáng táng thơ
ChatGPT của OpenAI vượt qua khả năng của Google
Đối với những tính năng này, bạn có thể xem chi tiết ở đây: ChatGPT của OpenAI có thể làm được những việc gì?
Ngoài ra, ChatGPT có thể đóng vai trò như là một Chatbot về y tế. Một người dùng Twitter có tên tài khoản là ‘Roxana Daneshjou MD/PhD’ đã đăng một dòng tweet như sau:
“Tôi đang thử nghiệm các kịch bản chăm sóc sức khỏe trên chatbot mới của OpenAI và cho đến nay tôi rất ấn tượng. Có vẻ như chatbot này có thể có tiềm năng như một chatbot y tế, nhưng rõ ràng là cần phải kiểm tra những thành kiến và thông tin sai lệch.”
ChatGPT có được dùng miễn phí không?
Hiện tại ChatGPT đang được mở miễn phí cho người dùng. Có thể đây là giai đoạn để hệ thống kiểm tra và sửa lỗi. Có thể sau này, ChatGPT sẽ có thu phí.
Hạn chế của ChatGPT là gì?
Chưa được huấn luyện về mảng tin tức
Nếu bạn hỏi ChatGPT các câu hỏi về mảng tin tức, thì câu trả lời nhận được như sau.
“Tôi xin lỗi, nhưng tôi không thể truy cập bất kỳ tin tức hiện tại nào vì dữ liệu đào tạo của tôi chỉ có hạn cho đến năm 2021 và tôi không có khả năng duyệt web. Có bất cứ điều gì khác tôi có thể giúp bạn với?”
Chưa trả lời được những câu hỏi ở mức suy luận phức tạp và nâng cao.
Nếu bạn hỏi ChatGPT các câu hỏi yêu cầu suy luận 3 bước, thì câu trả lời nhận được sẽ chưa chính xác. Ví dụ như trong hình sau:
Nếu bạn có dữ liệu A là bố của B; B là bố của C, thì ChatGPT có thể trả lời đúng mối quan hệ giữa A và C. Nhưng nếu bạn thêm 1 bước nữa; C là chồng của D, thì ChatGPT sẽ không trả lời đúng mối quan hệ giữa A và D.
Câu trả lời không đảm bảo là lúc nào cũng đúng.
Có một số ứng dụng trong thực tế đòi hỏi độ chính xác cao, ví dụ từ 95-100%, tuy nhiên ChatGPT vẫn đang ở bước kiểm thử, và vẫn chưa đảm bảo rằng các câu trả lời từ ChatGPT đều luôn đúng.
Đòi hỏi cấu hình máy tính mạnh để chạy phần mềm.
ChatGPT yêu cầu một lượng điện toán (computational power) đáng kể để chạy, điều này có thể gây khó khăn cho việc triển khai trong một số môi trường.
Vấn đề về quyền riêng tư.
Một mối quan tâm khác khi sử dụng ChatGPT là tác động tiềm ẩn về quyền riêng tư. Vì ChatGPT có thể giữ lại và sử dụng thông tin từ các cuộc trò chuyện trước đó nên có thể có những lo ngại về cách thu thập và lưu trữ dữ liệu cá nhân của ChatGPT. Đây là một vấn đề quan trọng mà các nhà phát triển và người dùng ChatGPT sẽ cần xem xét cẩn thận trong tương lai.
Chưa hỗ trợ tốt cho các ngôn ngữ khác.
Nếu bạn hỏi ChatGPT trên các ngôn ngữ khác, ví dụ như tiếng Việt, thì bạn dễ dàng tìm được câu trả lời sai của ChatGPT.
Trong ví dụ trên, ChatGPT đã trả lời sai. “Sài Gòn nằm trên sông Sài Gòn và là thủ đô của nước Việt Nam” hay “Bình Định về phía nam” (việc nói Bình Định giáp với Bình Định là một câu trả lời chưa hợp lý).
Ưu điểm của ChatGPT là gì?
Ngoài khả năng viết chương trình, tìm lỗi, sửa lỗi, phát hiện lỗ hổng bảo mật, sáng tác thơ, … Sau đây là một số ưu điểm của ChatGPT:
Như chúng ta quan sát ở một số câu trả lời của ChatGPT. Chúng ta có thể thấy rằng có những câu trả lời hoặc văn bản có chất lượng khá cao. Điều này có thể giúp tạo ra nội dung đa dạng và hấp dẫn hơn trong tương lai.
Có khả năng trả lời giống như con người đối với nhiều loại dữ liệu đầu vào khác nhau. Điều này làm cho ChatGPT trở nên lý tưởng cho các ứng dụng như chatbot và trợ lý ảo.
Có khả năng học hỏi và thích nghi với các bối cảnh mới (new contexts). Không giống như một số mô hình xử lý ngôn ngữ tự nhiên (NLP) khác, ChatGPT có thể lưu giữ thông tin từ các cuộc trò chuyện trong quá khứ và sử dụng những thông tin này để tạo phản hồi phù hợp và được cá nhân hóa hơn. Điều này cho phép ChatGPT cung cấp trải nghiệm người dùng tự nhiên và trực quan hơn.
ChatGPT được tạo ra như thế nào?
Theo mô tả từ trang web openai.com, “Chúng tôi đã đào tạo mô hình này bằng cách sử dụng Học tăng cường từ phản hồi của con người (Reinforcement Learning from Human Feedback – RLHF), sử dụng các phương pháp tương tự như InstructGPT, nhưng có một số khác biệt nhỏ trong việc thiết lập quá trình thu thập dữ liệu.”
Quá trình huấn luyện ChatGPT bao gồm 3 bước chính như sau:
Bước 1: Thu thập dữ liệu và huấn luyện một mô hình chính sách bằng cách sử dụng việc học có giám sát (supervised fine-tuning/learning).
Bước 2: Thu thập dữ liệu so sánh và huấn luyện một mô hình phần thưởng (a reward model).
Bước 3: Tối ưu hóa chính sách (ở bước 1) so với mô hình phần thưởng (ở bước 2) bằng thuật toán học tăng cường PPO.
PPO là từ viết tắt của từ Proximal Policy Optimization, là một thuật toán trong học tăng cường, được OpenAI giới thiệu vào tháng 7/2017.
Chi tiết về dữ liệu:
Ở bước 1, dữ liệu được thu thập như sau: những người có chuyên môn về tạo dữ liệu cho AI, đóng cả hai vai trò, người dùng, và trợ lý AI. Họ truy cập vào các mô hình khác mà có thể cung cấp cho họ các ý tưởng để viết các kịch bản trong đoạn hội thoại giữa người dùng và trợ lý AI.
Dữ liệu cuối cùng dùng cho việc huấn luyện ở bước 1 là dữ liệu kết hợp giữa các đoạn hội thoại này (được tạo ra như mô tả ở trên) và dữ liệu InstructGPT (sau khi đã chuyển sang dạng hội thoại).
Ở bước 2, dữ liệu được tạo ra bằng cách sử dụng các đoạn hội thoại giữa những người có chuyên môn về tạo dữ liệu cho AI và chatbot. Sau đó, các chuyên gia này sẽ sắp xếp thứ tự của các đoạn hội thoại này. Có thể sắp xếp theo thứ tự từ đạt kết quả cao đến cho kết quả thấp.
Cơ sở kiến thức của ChatGPT là gì?
Để tạo ra được ChatGPT, trước đó đã có rất nhiều công trình nghiên cứu khác.
Đầu tiên, phải để đến công trình nghiên cứu về Transformer, từ bài báo: Attention Is All You Need. Transformer có thể được sử dụng để dịch một câu hay đoạn văn từ một ngôn ngữ này sang một ngôn ngữ khác.
Ví dụ, chúng ta có một câu tiếng Việt và muốn dịch câu này sang tiếng Anh. Thì câu tiếng Việt gọi là câu đầu vào (input), sẽ được chuyển sang một biểu diễn khác, dạng số, ví dụ một vector với số chiều là 748. Hy vọng là vector này sẽ chứa tất cả thông tin cần thiết cho câu đầu vào. Sau đó, một bộ phận khác, sẽ tìm cách sinh ra một câu tiếng Anh (câu đầu ra – output), dựa vào vector 748 chiều này.
Thông tin về BERT và các mô hình khác
Nhờ sự thành công của Transformer, sau đó nhóm nghiên cứu Google đã tạo ra một mô hình ngôn ngữ khác, gọi là BERT. BERT đã cải tiến rất nhiều kết quả trong nhiều bài toán trong xử lý ngôn ngữ tự nhiên.
Sau đó, dần dần, có rất nhiều các mô hình ngôn ngữ khác đã được tạo ra; ví dụ như: RoBERTa, T5, VideoBERT, SpeechBERT, ALBERT, StructBERT, GPT, GPT3, DistilBERT, … Đến hiện tại, đã có rất nhiều mô hình ngôn ngữ khác nhau được tạo ra, và được sử dụng với các mục đích khác nhau.
Liên Liên
Quý độc giả, có thể xem thêm bài này: Pre-trained Models for Natural Language Processing: A Survey.
***
Chuyên gia IT: ChatGPT có khả năng trở thành công cụ dẫn dắt dư luận của nhà cầm quyền
ChatGPT hiện đang thu hút cư dân mạng toàn cầu với tính năng trò chuyện và trả lời các câu hỏi của người dùng ở hầu hết mọi lĩnh vực chỉ trong vài giây. Ước tính, chỉ sau hai tháng ra mắt, số người đăng ký tài khoản ChatGPT đã đạt mốc 100 triệu vào tháng một.
ChatGPT, được hiểu là một công cụ văn bản được hỗ trợ bởi trí tuệ nhân tạo (AI). Người dùng có thể trò chuyện, tương tác với ChatGPT để hỏi về bất kỳ điều gì, từ khoa học công nghệ cho đến chính trị xã hội… ChatGPT sẽ truy tìm dữ liệu trên internet, cùng với khoảng 300 tỷ từ ngữ có sẵn để trả đáp án.
Thậm chí, ChatGPT còn có thể làm thơ hoặc tạo ra một bài diễn văn với câu từ tự nhiên, ngữ pháp chuẩn chỉnh. Tuy nhiên, chính OpenAI – công ty tạo ra ChatGPT, cảnh báo người dùng rằng không phải tất cả các câu trả lời đều đúng.
Mức độ khả tín đến đâu?
Không đứng ngoài trào lưu này, nhiều người ở Việt Nam đã tìm cách tạo tài khoản để được trải nghiệm ChatGPT, dù ChatGPT chưa hỗ trợ cho tạo tài khoản ở Việt Nam.
Một số chuyên gia về công nghệ thông tin cảnh báo về mức độ khả tín của ChatGPT; và nếu nó không hoàn thiện để đủ thông minh, thì có thể trở thành công cụ tuyên truyền, dẫn dắt, định hướng dư luận từ các Chính phủ độc tài, mà Việt nam là một điển hình.
Ông Hoàng Ngọc Diêu, có hơn 30 năm kinh nghiệm làm việc trong ngành công nghệ thông tin, sau khi tự trải nghiệm với ChatGPT đã rút ra kết luận rằng khi nhận câu hỏi, ChatGPT sẽ dựa trên các cơ sở dữ diệu đã được thu thập từ internet để cho ra câu trả lời.
Do vậy, các câu hỏi khoa học căn bản thì ChatGPT sẽ trả lời tốt. Tuy nhiên, các câu hỏi yêu cầu các kiến thức chuyên sâu mà không có nhiều thông tin trên mạng internet thì ChatGPT sẽ cho ra đáp án không chính xác.
Với cơ chế hoạt động như vậy, ông Diêu lo ngại ChatGPT sẽ là nguồn phát tán ra các thông tin sai lệch, chưa được kiểm chứng:
“Thông tin trên Internet thì vàng thau lẫn lộn, đủ các loại, đó là một điểm rất nguy hiểm. Nó có thể thu thập các thông tin tin gây hiểu lầm, những thông tin sai hoặc là chưa được kiểm chứng, xác thực.
Cũng có thể là nó thu thập những thông tin từ cái gọi là nguồn chính thống, nhưng những nguồn đó cũng chưa hẳn đã là minh bạch, đủ để có tính chính xác cao.
Ví dụ, nó lấy thông tin từ các nhà nước độc tài, những thông tin công khai từ các nhà nước độc tài thường là đã được son phết, che đậy sự thật, thì chính vì vậy mà nó có thể tạo ra những output (kết quả – PV) bị sai lệch.”
Ngoài ra, ChatGPT rất lúng túng với các câu hỏi về lĩnh vực nhân văn xã hội. Những câu hỏi về lịch sử thì trả lời một cách nước đôi, tránh né. Nó không có câu trả lời rõ ràng cho các vấn chính trị, như thế nào là đúng, là sai – ông Diêu cho biết thêm.
Trở thành công cụ dẫn dắt dư luận?
Sen Hồng – một nhóm Dư luận viên tuyên truyền cho Đảng, nhà nước Việt Nam. Ảnh: Reuters
Ngoài ra, dựa vào các đoạn hội thoại với ChatGPT, ông Hoàng Ngọc Diêu còn nhận thấy rằng với vấn đề mà có nhiều thông tin khác nhau trên không gian mạng, thì những thông tin nào được đề xuất nhiều, tần suất lặp đi lặp lại nhiều lần thì ChatGPT có xu hướng chọn thông tin đó làm câu trả lời cho người dùng.
ChatGPT có khả năng tự học, tự nạp thêm dữ liệu sau mỗi lần chat với người dùng. Ông Diêu cho rằng Chính quyền Hà Nội hoàn toàn có thể huy động nhân lực hùng hậu ngồi chat với ChatGPT. Sau một thời gian, ChatGPT sẽ trả lại các kết quả có lợi cho Nhà nước:
“Nếu như một nhà nước độc tài họ thấy có thể khai thác công cụ chatGPT như là một phương tiện để tuyên truyền thì họ sẽ không ngần ngại để làm chuyện đó.
Họ đã có một ực lượng rất lớn có thể ngồi đó để dạy cho cho con AIbot này để nó trả lời, thì đương nhiên nó sẽ biến thành một công cụ hết sức là quan trọng với họ trong vấn đề tuyên truyền.”
Một chuyên gia ngành công nghệ thông tin, hiện đang ở Việt Nam, yêu cầu giấu danh tính vì lý do an toàn, cho biết ông cũng có nhận định tương tự; đồng thời đưa ra cảnh báo rằng Chính quyền hoàn toàn có lợi dụng cơ chế hoạt động này của ChatGPT để định hướng, dẫn dắt dư luận:
“Nếu ở tầm cá nhân mình không thể làm nổi chuyện đó nhưng nếu ở tầng Chính phủ thì được. Khi mà họ (Chính phủ – PV) đã hiểu rõ nguyên lý làm việc của một hệ thống nào đó thì họ sẽ tìm cách để thao túng.”
Vị chuyên gia giấu tên dẫn lại chuyện lực lượng dư luận viên đã báo cáo vi phạm hàng loạt các tài khoản hoặc bài viết chỉ trích Nhà nước trên Facebook; hoặc là Chính quyền cũng đã cử người sửa các bài viết trên trang Wikipedia:
“Cũng như Facebook vậy thôi, họ hiểu rằng cơ chế report (báo cáo – PV) thì cần số đông nên Chính phủ sẽ huy động một đạo quân để bấm vào nút report trên Facebook.
Cũng giống như Wikipedia, bây giờ khi tìm các bài viết về chính trị ở trên Wikipedia thì nó cũng đã bị thao túng rồi, tức là Chính phủ đã cử người vào ban biên tập của Wikipedia để chỉnh lại hết các bài viết.”
Các chuyên gia cho rằng còn quá sớm để khẳng định bất cứ điều gì về tầm ảnh hưởng của ChatGPT. Tuy nhiên, để tránh bị dẫn dắt bởi các thông tin sai lệch từ các công cụ trí tuệ nhân tạo, lời khuyên được các chuyên gia nêu trên đưa ra là chỉ nên xem ChatGPT như là một công cụ gợi ý, người dùng cần phải có kiến thức nền về vấn đề mình muốn tìm hiểu, nghiên cứu. Đồng thời, phải luôn đặt câu hỏi, so sách đối chiếu để tự tìm ra được một câu trả lời chính xác, trung thực cho mình.
RFA (06.02.2023)