Tiêu đề gốc: "a16z dẫn đầu vòng hạt giống trị giá 33 triệu đô la, Yupp định hình lại mô hình đánh giá AI dựa trên blockchain và các ưu đãi như thế nào?"
Tác giả gốc: ShenZhen, PANews
Khi các ứng dụng AI thâm nhập vào mọi tầng lớp xã hội, cách đánh giá chính xác hiệu suất của mô hình và nâng cao lòng tin của người dùng đã trở thành một vấn đề cần được giải quyết khẩn cấp. Các đánh giá truyền thống dựa vào các cơ chế tập trung, khó có thể bao quát các tình huống đa dạng và không thể phản ánh sở thích thực sự của người dùng; đồng thời, các vấn đề "ảo giác" của mô hình thường xuyên xảy ra và người dùng thường rơi vào kén thông tin khi đưa ra lựa chọn.
Trong bối cảnh này, Yupp, với tư cách là một nền tảng mới, đang cố gắng định hình lại cách các mô hình AI được phát hiện, so sánh và sử dụng bằng mô hình crowdsourcing độc đáo và cơ chế khuyến khích của mình, đồng thời mang lại sự thay đổi mô hình cho lĩnh vực đánh giá AI. Bài viết này sẽ phân tích sâu về cơ chế cốt lõi của Yupp, các điểm nổi bật về mặt kỹ thuật, bối cảnh nhóm và tác động tiềm tàng của nó đối với hệ sinh thái AI.
Yupp cam kết giải quyết các vấn đề đánh giá lâu đời trong lĩnh vực AI và xây dựng một thị trường phản hồi AI "không cần tin cậy" - cho phép phản hồi đa dạng của người dùng được lưu hành tự do dưới sự bảo vệ của các ưu đãi blockchain và kinh tế tiền điện tử, từ đó hình thành một lớp đánh giá mô hình có khả năng mở rộng, công bằng và minh bạch. Thông qua việc phân phối ưu đãi cho dữ liệu được gắn nhãn thủ công chất lượng cao, Yupp có thể nắm bắt kịp thời nhu cầu và sở thích của người dùng thực trong các tình huống khác nhau, giúp các nhà phát triển AI tối ưu hóa hiệu suất mô hình theo cách lặp lại.
Dự án được thành lập vào tháng 6 năm 2024 bởi Pankaj Gupta (đồng sáng lập kiêm CEO) và Gilad Mishne (đồng sáng lập kiêm giám đốc AI), và Nhà khoa học trưởng Jimmy Lin (Giáo sư tại Đại học Waterloo) cũng tham gia vào nhóm cốt lõi. Cả ba đã làm việc cùng nhau tại Twitter từ năm 2010, đã xây dựng và tối ưu hóa các hệ thống tìm kiếm và đề xuất quy mô lớn, sau đó tích lũy được nhiều kinh nghiệm tại Google và Coinbase.
Yupp đã giành được sự công nhận cao từ những nhân vật nổi tiếng trong ngành công nghệ và các nhà đầu tư mạo hiểm hàng đầu vì tầm nhìn về sự phân cấp và minh bạch của giá trị dữ liệu, có thể đáp ứng nhu cầu kép của các nhà sản xuất AI về đánh giá đáng tin cậy và sự tham gia của người dùng, cũng như bản lý lịch phong phú của nhóm cốt lõi.
Tuần trước, Yupp đã công bố hoàn thành vòng tài trợ hạt giống trị giá 33 triệu đô la, do đối tác A16z Chris Dixon dẫn đầu. Các nhà đầu tư khác bao gồm Nhà khoa học trưởng của Google Jeff Dean, đồng sáng lập Twitter Biz Stone, đồng sáng lập Pinterest Evan Sharp, Tổng giám đốc điều hành Perplexity Aravind Srinivas, Đại học Stanford Dan Boneh, Chris Re, Nick McKeown và Balaji Prabhakar, 45 thiên thần và giám đốc điều hành công ty nổi tiếng, và Coinbase Ventures.
Là một nền tảng đánh giá AI tập trung, Yupp tuân thủ khái niệm "Mọi AI cho mọi người", cho phép người dùng dễ dàng khám phá, so sánh và sử dụng các mô hình AI mới nhất. Không giống như các phản hồi đơn lẻ truyền thống, Yupp trả về các câu trả lời từ hai (hoặc thậm chí nhiều hơn) mô hình cho mỗi lời nhắc, tạo thành một "Quốc hội AI". Thiết kế này không chỉ đáp ứng nhu cầu của người dùng về các lựa chọn đa dạng mà còn xác định hiệu quả các "ảo giác" có thể có trong mô hình, giúp người dùng đưa ra quyết định sáng suốt hơn thông qua so sánh. Như CEO của Yupp, Pankaj Gupta đã nói, đầu ra song song đặc biệt có lợi cho những người dùng lo ngại về lỗi tạo vì họ có thể sử dụng nó để xác thực chéo các kết quả.
Nền tảng này hiện hỗ trợ hơn 500 mô hình AI, bao gồm tạo văn bản và hình ảnh, bao gồm các mô hình nổi tiếng như ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama và nhiều mô hình mới nổi. Để tối ưu hóa trải nghiệm hơn nữa, Yupp cũng đã ra mắt tính năng "QuickTake", có thể tinh chỉnh các câu trả lời dài thành một tweet ngắn gọn.
Ngoài ra, Yupp rất coi trọng quyền riêng tư của người dùng: tất cả các bản ghi trò chuyện đều ở chế độ riêng tư theo mặc định trừ khi người dùng chủ động tiết lộ chúng; ngay cả khi chúng được chia sẻ công khai, không có thông tin cá nhân nào bị tiết lộ. Người dùng có thể kiểm soát nội dung và phạm vi chia sẻ bất kỳ lúc nào.
Yupp kết hợp việc sử dụng miễn phí với phản hồi của người dùng và đo lường mức sử dụng mô hình thông qua hệ thống "Điểm Yupp". Người dùng mới sẽ nhận được 5.000 điểm trong vòng vài giây sau khi đăng ký và có thể kiếm thêm điểm bằng cách đánh giá phản hồi của mô hình, chọn tùy chọn và giải thích lý do. Chất lượng phản hồi càng cao thì phần thưởng càng phong phú, đảm bảo rằng người dùng có thể tiếp tục sử dụng các mô hình cao cấp như Claude Opus 4 hoặc OpenAI o3 miễn phí. Nền tảng này cam kết rằng điểm sẽ chỉ tăng chứ không giảm và tất cả các mô hình hiện tại đều có thể dùng thử miễn phí.
Sau mỗi câu hỏi, người dùng sẽ nhận được hai câu trả lời mô hình và giành được "thẻ cào kỹ thuật số" thông qua phản hồi, sẽ thưởng từ 0 đến 250 điểm Yupp. Cứ 1.000 điểm có thể đổi thành 1 đô la và người dùng có thể rút tối đa 10 đô la mỗi ngày và tối đa 50 đô la mỗi tháng. Điểm có thể đổi thành hơn 20 loại tiền tệ như đô la Mỹ và euro và các đối tác bao gồm Stripe, PayPal và Coinbase. Đồng thời, nền tảng này tích hợp Base Ethernet L2 và Solana stablecoin để cung cấp phần thưởng tức thì và miễn phí cho người dùng trên toàn thế giới.
Như Pankaj Gupta đã nói, phản hồi chất lượng cao do người dùng tạo ra có giá trị hơn nhiều đối với các công ty AI để tinh chỉnh mô hình và học tăng cường so với phần thưởng. Mặc dù thu nhập hàng tháng của người dùng có thể chỉ tương đương với một vài tách cà phê, nhưng dữ liệu được gắn nhãn trả phí này rất quan trọng đối với quá trình lặp lại của AI.
Để khuyến khích nhiều người tham gia hơn, Yupp cũng thiết lập phần thưởng giới thiệu: người giới thiệu nhận được 5.000 điểm và người giới thiệu nhận được 1.000 điểm; hiện tại, người dùng mới đăng ký có thể nhận được 5.000 điểm và người giới thiệu nhận được thêm 2.500 điểm.
Để ứng phó với tình trạng thiếu minh bạch, công bằng và thu thập dữ liệu đánh giá không đồng đều trong các bảng xếp hạng hiện có, Yupp đã ra mắt phiên bản beta của bảng xếp hạng AI và hệ thống tính điểm "Điểm Yupp VIBE (Vibe Intelligence Benchmark)". Hệ thống thu thập dữ liệu sở thích do người dùng toàn cầu tạo ra trong các tương tác tự nhiên và cố gắng cung cấp kết quả đánh giá đáng tin cậy và mạnh mẽ.
Các nguyên tắc đánh giá của Yupp bao gồm:
· Tính mạnh mẽ:Đảm bảo tính đại diện (bao gồm nhiều tình huống khác nhau), tính xác thực (phản ánh mối quan tâm của người dùng) và chống gian lận (chống lại hành vi ác ý);
· Đáng tin cậy:Công bằng và trung lập (không thiên vị mô hình), minh bạch và cởi mở (tiết lộ chi tiết các thuật toán xếp hạng) và khoa học nghiêm ngặt (tuân theo các tiêu chuẩn đánh giá).
Nền tảng này không chỉ thu thập các sở thích nhị phân mà còn khuyến khích người dùng chỉ ra ưu điểm và nhược điểm của các câu trả lời (chẳng hạn như "đi thẳng vào vấn đề", "tốc độ nhanh", "phong cách tốt", v.v.) và tiến hành phân tích nhóm dựa trên độ tuổi, trình độ học vấn, nghề nghiệp và thông tin khác của người dùng để chỉ ra sự khác biệt về sở thích của các nhóm khác nhau.
Về mặt kỹ thuật, Yupp đang khám phá việc sử dụng các công nghệ như blockchain, nguyên thủy mật mã và bằng chứng không kiến thức để đảm bảo rằng quá trình đánh giá là công bằng, minh bạch và có thể xác minh được. Đồng thời, nền tảng này đã hợp tác với các nhà cung cấp dữ liệu AI chuyên nghiệp để hiệu chỉnh các công cụ chấm điểm thông qua xác minh lưu trữ và kiểm tra chất lượng nhiều lớp để loại bỏ dữ liệu độc hại.
Danh sách gần đây đã được cập nhật để hiển thị điểm VIBE của các mô hình như GPT‑4.5 Preview, Claude Opus 4 và Claude Sonnet 4, cũng như tỷ lệ thắng, tỷ lệ không thích, tốc độ, độ trễ, cửa sổ ngữ cảnh và các chỉ số chi phí của chúng.
Yupp chính thức ra mắt vào ngày 13 tháng 6 năm 2025, sau sáu tháng thử nghiệm nội bộ. Kể từ khi ra mắt, sản phẩm đã liên tục được lặp lại:
· Hỗ trợ đa phương thức: Truy cập vào các mô hình như Dall‑E, Flux, Stable Diffusion, Luma Photon, Google Imagen 4 và hỗ trợ người dùng tải lên hình ảnh/PDF để đặt câu hỏi;
· Mở rộng tương tác: Thêm chức năng nhập liệu bằng giọng nói và đọc giọng nói;
· Cập nhật mô hình: Dần dần giới thiệu DeepSeek R1/V3, Mistral Small 3, OpenAI o3‑pro, Hermes 3, Amazon Nova Pro v1, Microsoft Phi series và danh mục "MAX model";
· Thông tin thời gian thực: Chuyển hướng các yêu cầu truy vấn trực tuyến đến Perplexity và Google Gemini Live, với các trích dẫn có siêu liên kết;
· Nâng cấp thanh toán: Thêm PayPal Hoa Kỳ, rút tiền Venmo và hỗ trợ PayPal cho 24 loại tiền tệ;
· Chia sẻ xuất: Hỗ trợ sao chép với định dạng giữ nguyên, xuất PDF/văn bản/Markdown và chia sẻ các câu trả lời đơn lẻ hoặc toàn bộ cuộc trò chuyện theo yêu cầu; Hoạt động cộng đồng: Tổ chức các hoạt động như "Thử thách nhắc nhở AI" với giải thưởng lên đến hàng chục nghìn điểm; thêm các tính năng mới như trang hồ sơ cá nhân và tên trò chuyện do AI tạo ra. Sứ mệnh của Yupp là "trao quyền cho con người để định hình tương lai của AI". Pankaj Gupta tin rằng sự phát triển của AI đòi hỏi sự tham gia và đóng góp của mọi người. Thông qua các phản hồi AI đa góc nhìn và phản hồi của người dùng, Yupp không chỉ giúp người dùng đưa ra quyết định tốt hơn mà còn cung cấp nguồn năng lượng liên tục cho sự phát triển của AI. Điều đáng nói là một trong những đối thủ cạnh tranh chính của Yupp là nền tảng đánh giá mô hình AI mở LMArena (URL: https://lmarena.ai/), rất phổ biến trong số những người trong ngành AI, nhưng nền tảng này hiện đang trong giai đoạn thăm dò thương mại và không sử dụng công nghệ blockchain để cung cấp phần thưởng vật chất trực tiếp hoặc điểm khuyến khích cho sự tham gia của người dùng.
Nhìn chung, Yupp đã mở ra một con đường mới cho việc đánh giá AI với mô hình crowdsourcing, cơ chế khuyến khích và hệ thống đánh giá được thúc đẩy bởi sở thích thực tế của người dùng. Nó không chỉ cung cấp cho người dùng những trải nghiệm tương tác AI miễn phí và đa dạng mà còn chuyển đổi phản hồi của người dùng thành dữ liệu đào tạo có giá trị cao để thúc đẩy quá trình tối ưu hóa mô hình liên tục. Với một đội ngũ giàu kinh nghiệm và sự hỗ trợ vốn hàng đầu, Yupp được kỳ vọng sẽ đóng vai trò quan trọng trong hệ sinh thái AI trong tương lai và hiện thực hóa tầm nhìn "mọi người đều thích AI và mọi người đều định hình AI".
Tuy nhiên, đối với Yupp, một nền tảng vừa mới ra mắt, làm thế nào để liên tục đảm bảo chất lượng dữ liệu, chống lại gian lận tiềm ẩn và tạo ra sự cân bằng giữa thương mại hóa và các ưu đãi cho người dùng khi có sự tham gia của người dùng quy mô lớn vẫn sẽ là hướng đi cần được tiếp tục khám phá và tối ưu hóa trong quá trình phát triển trong tương lai.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia