Lỗi 'trông vẫn ổn': Cách phát hiện những thất bại âm thầm trong app bạn tạo bằng AI

Công cụ tạo app bằng AI của bạn đã tạo ra một biểu mẫu liên hệ. Bạn gõ tên mình, bấm gửi, thấy thông báo thành công thân thiện, rồi đi làm việc khác. Một tuần sau bạn nhắc đến cái trang đó với một người bạn, người này hỏi đã có ai điền vào chưa. Bạn vào kiểm tra. Ba lượt gửi đang nằm ở một trạng thái chờ nào đó. Không lượt nào trong số đó từng đến được hộp thư của bạn.

Đây là kiểu thất bại phổ biến nhất với một app tạo bằng AI, và nó không phải kiểu mà phần lớn người ta lo lắng. Những lỗi hiện chữ đỏ thì dễ tìm — công cụ AI của bạn sẽ sửa chúng trong hai phút. Những lỗi nguy hiểm là những lỗi mà màn hình trông vẫn ổn, người dùng tưởng đã xong, còn bạn thì cả tháng sau mới phát hiện ra.

Bài viết này là một danh sách kiểm tra để bắt được những lỗi đó. Không phải “cách kiểm thử như một kỹ sư QA” — chỉ là năm chỗ mà người dùng thật bị thiệt bởi một app tạo bằng AI trông như đang chạy.

1. Gửi thử một thứ gì đó và kiểm tra xem nó có thật sự đi đến đâu không

Khi công cụ AI của bạn tạo một biểu mẫu, hãy hỏi một câu: dữ liệu đi đâu? Không phải theo nghĩa trừu tượng — mà theo nghĩa đen, sau khi gửi bạn có thể vào đâu để xem nó?

Một số lượng lớn đến bất ngờ các biểu mẫu loại này gửi vào một bộ xử lý chỉ trả về “Cảm ơn bạn!” mà không hề gửi email, lưu vào cơ sở dữ liệu, hay báo cho ai. Biểu mẫu chỉ là một bộ mặt lịch sự. Vậy nên:

Gửi một mục thử với một cái tên giả nhưng dễ nhận ra, kiểu như “ZZZ TEST”.
Mở bảng điều khiển, cơ sở dữ liệu, hộp thư, bảng tính — bất cứ nơi nào các lượt gửi được cho là sẽ rơi vào.
Tìm mục “ZZZ TEST” của bạn ở đó, với đúng dấu thời gian.

Nếu bạn không tìm được nó trong vòng một phút, biểu mẫu của bạn hỏng rồi, dù nó có chúc mừng bạn đã gửi xong. Tôi từng thấy một biểu mẫu “liên hệ” trên một trang đích trả phí thu được số khách hàng tiềm năng bằng không suốt ba tuần vì bước gửi email chưa bao giờ được nối dây. Trang trông hoàn hảo.

2. Thử con đường mà bạn chẳng bao giờ đi

Bạn biết app của mình làm gì vì bạn đã chứng kiến nó được xây nên. Bạn bấm các nút theo đúng một thứ tự mỗi lần. Người dùng thật thì không.

Hãy chọn con đường mà bạn thấy kỳ cục nhất:

Bấm gửi hai lần liên tiếp, thật nhanh.
Tải lại trang giữa lúc đang làm dở một việc.
Mở nó trong một cửa sổ ẩn danh, không đăng nhập.
Gõ một cái tên có dấu nháy đơn (O’Brien là kẻ phá hoại kinh điển).
Gõ một con số vào một trường yêu cầu nhập số, nhưng để nó âm hoặc bằng không.

Nếu có thứ gì đó hỏng một cách hiện ra, đó là một lỗi thật — nhưng ít ra nó ồn ào. Phiên bản “trông vẫn ổn” là khi cú bấm thứ hai tạo ra một bản ghi trùng lặp và nhìn màn hình thì không cách nào biết được. Hãy vào cơ sở dữ liệu kiểm tra và tìm hai dòng “ZZZ TEST” với dấu thời gian cách nhau hai giây. Nếu bạn thấy chúng, biểu mẫu cần một cơ chế chống trùng.

3. Đợi một ngày, rồi quay lại

Rất nhiều code do AI tạo dùng bộ nhớ tạm thời, bộ nhớ này được đặt lại khi app triển khai lại hoặc khởi động lại. App giữ dữ liệu của bạn trong một thứ mà lập trình viên gọi là “trạng thái trong bộ nhớ” — ổn cho một bản demo, tệ hại cho bất cứ thứ gì thật sự.

Bài kiểm tra này tàn nhẫn mà dễ: nhập một ít dữ liệu, đóng tab, đợi hai mươi tư giờ, rồi quay lại. Nếu dữ liệu của bạn biến mất hoặc lộn xộn, nghĩa là phần lưu trữ không có thật. Có lẽ bạn cần nói với công cụ AI bằng lời thường: “dữ liệu này cần tồn tại được qua một lần khởi động lại máy chủ.” Phần lớn công cụ sẽ chuyển sang dùng cơ sở dữ liệu khi được yêu cầu; một số sẽ không, trừ khi bạn nói.

Bạn có thể chạy một phiên bản nhanh hơn của bài kiểm tra này bằng cách hỏi công cụ trong khung trò chuyện: “dữ liệu của biểu mẫu này đang được lưu ở đâu, và nó có tồn tại qua một lần triển khai lại không?” Nếu câu trả lời nhắc đến “trong bộ nhớ”, “phiên”, hay “cho lần chạy này”, thì bạn đã tìm ra lỗi trước khi bất kỳ người dùng nào gặp phải.

4. Cho một người không phải bạn xem nó

Bạn biết app của mình có nghĩa là gì. Bạn đã thiết kế nó. Bạn đặt tên cho các nút. Các nhãn hiển nhiên với bạn vì bạn viết ra chúng.

Hãy cho một người bạn xem mà không giải thích gì. Nói: “Thử làm X đi.” Quan sát họ. Đừng giúp. Ba điều sẽ xảy ra:

Họ sẽ bấm vào một chỗ bạn không ngờ tới, và app sẽ làm điều gì đó bất ngờ.
Họ sẽ mắc kẹt ở một cái nhãn mà bạn thấy hiển nhiên khi viết.
Họ sẽ làm đúng việc bạn muốn, nhưng bằng một nửa số bước bạn tưởng tượng, và bỏ qua hẳn một màn hình — đôi khi là một màn hình mà app trông cậy vào việc họ phải điền.

Mỗi điều đó là một lỗi thật. Không điều nào trong số đó hiện ra lỗi. Người bạn sẽ nói: “Ồ, dễ thương đấy”, rồi đưa laptop lại cho bạn. Còn bạn sẽ biết, qua nét mặt họ, rằng họ đã lạc lối ba mươi giây ở một chỗ mà bạn không ngờ có chút khe hở nào.

5. Đọc email nó gửi, trên điện thoại

Nếu app của bạn gửi email — xác nhận, đặt lại mật khẩu, hóa đơn — hãy mở một cái trên điện thoại của bạn, và một cái nữa trên một ứng dụng email khác với cái bạn thường dùng. App tạo bằng AI có xu hướng tạo ra những email trông tuyệt đẹp trên Gmail máy tính nhưng trông như nhiễu sóng trên Outlook trên Android.

Logic tương tự áp dụng cho biên nhận PDF, các bản xuất dữ liệu tải về, và những nút “chia sẻ liên kết này”. Thứ rời khỏi app của bạn, đi vào thế giới thật, là phần ít được kiểm thử nhất của một bản dựng bằng AI. Nó cũng là phần mà người dùng của bạn thấy nhiều nhất. Một nhà sáng lập tôi biết đã ra mắt một luồng thanh toán đẹp đẽ mà biên nhận PDF của nó, trên iPhone, là một ô vuông đen sì. Chẳng ai phàn nàn — họ chỉ thôi mua.

Sự thật khó nghe về “nó chạy được”

Khi bạn xây bằng công cụ tạo app bằng AI, “nó chạy được” có nghĩa là “nó chạy trên máy của tôi, trong trình duyệt của tôi, với đúng những cú bấm của tôi, vào đúng cái ngày tôi xây nó.” Đó là một tuyên bố nhỏ hơn nhiều so với vẻ ngoài của nó.

App thật chạy được khi:

Một người khác dùng chúng.
Dữ liệu trụ lại lâu hơn buổi demo.
Con đường xuyên qua app là con đường bạn không lường trước.
Đầu ra được đọc trên một thiết bị bạn không kiểm thử.

Bạn không cần trở thành một người kiểm thử phần mềm để ra mắt một thứ tốt. Bạn chỉ cần làm năm bước kiểm tra này một lần, vào hôm trước khi nói với bất cứ ai rằng app tồn tại. Chúng tốn khoảng hai mươi phút. Chúng sẽ bắt được chín trên mười lỗi âm thầm mà lẽ ra sẽ đến tay một người dùng trả tiền.

Nếu bạn chỉ có thời gian cho một bước, hãy làm bước đầu tiên. Gửi thử một thứ gì đó. Tìm nó ở phía bên kia. Phần lớn app tạo bằng AI trông vẫn ổn. Mẹo là đảm bảo chúng thật sự ổn.

Nếu bài này chạm đến bạn, việc đáng làm tiếp theo là ngồi với một tờ giấy và viết ra ba thứ mà app của bạn tuyệt đối không bao giờ được âm thầm thất bại — biểu mẫu, email, thanh toán, hay bất cứ thứ gì là của bạn — rồi rà qua từng cái bằng các bước kiểm tra ở trên. Hai mươi phút bây giờ mua cho bạn rất nhiều đêm ngủ ngon sau này.