به اشتراک بگذارید

11 دسامبر 2024

تجربه "محاسبات زبان طبیعی" Gemini Powers tldraw

ویشال دارمادیکاری

مهندس راه حل های محصول

استیو رویز

Tldraw

Tldraw ویترین قهرمان

باز کردن تعاملات زبان طبیعی با API Gemini

Gemini API به توسعه دهندگان این ��مکان را می دهد تا به طور یکپارچه قابلیت های پیشرفته هوش مصنوعی را در برنامه های خود ادغام کنند و امکانات جدیدی را برای تجربه و عملکرد کاربر باز کند. این پست نشان می‌دهد که چگونه tldraw از Gemini برای ایجاد یک تجربه انقلابی "محاسبات زبان طبیعی" در پروژه جدید خود، رایانه استفاده می‌کند. این نشان می‌دهد که استارت‌آپ‌ها می‌توانند با استفاده از Gemini API و SDK canvas tldraw، هوش مصنوعی قدرتمند را با سرعت و سهولت ادغام کنند. تیم tldraw به زودی کامپیوتر را با فلش Gemini 1.5 راه اندازی می کند ( به لیست انتظار بپیوندید ) و در حال حاضر در حال نمونه سازی با Gemini 2.0 Flash برای تکرارهای بعدی است.

tldraw از Gemini API استفاده می‌کند تا قدرت هوش مصنوعی محاوره‌ای را به برنامه‌نویسی بصری بیاورد و به کاربران امکان می‌دهد محتوا تولید کنند و اطلاعات را با استفاده از زبان طبیعی پردازش کنند. این فرصت‌های هیجان‌انگیزی را برای تجربه کاربر بصری‌تر و کارآمدتر در اطراف هوش مصنوعی باز می‌کند و مرزهای ارتباط بصری را پیش می‌برد.

چشم انداز پشت کامپیوتر

tldraw، در تلاش برای قابل دسترس کردن و شهودی کردن نمودارها، روشی طبیعی تری برای تعامل کاربران با بوم خود در نظر گرفت. بنیانگذار استیو رویز به دنبال استفاده از قدرت SDK بوم بی نهایت tldraw برای ایجاد یک محیط پویا برای کار با هوش مصنوعی مولد بود. این دیدگاه منجر به توسعه رایانه شد، یک برنامه آزمایشی که در آن کاربران جریان های کاری را از بلوک های متن، تصاویر و دستورالعمل ها ایجاد می کنند. هنگام اجرا، اطلاعات از یک مؤلفه به مؤلفه بعدی جریان می یابد و خروجی هر نسل به عنوان ورودی برای نسل بعدی عمل می کند و فرآیندهای قدرتمندی را ایجاد می کند که برای تولید خروجی ها شاخه، حلقه و تکرار می شوند.

ساختمان با Gemini 2.0: شیرجه عمیق در کامپیوتر

کامپیوتر tldraw بر روی شبکه‌ای از اجزای به هم پیوسته ساخته شده است که عناصر روی بوم را نشان می‌دهند (جعبه‌های متن، تصاویر، کلیپ‌های صوتی و غیره). این مؤلفه‌ها با فلش‌هایی به هم مرتبط می‌شوند و جریان داده‌ها و تبدیل‌ها را تجسم می‌کنند. هر مؤلفه دارای «روش‌هایی» است - مجموعه‌ای از دستورالعمل‌ها که بر اساس ورودی‌های اجزای متصل اجرا می‌شوند. یک کامپوننت می‌تواند داده‌ها را از هر تعداد مؤلفه دیگر بپذیرد و داده‌های خروجی خود را به بسیاری از مؤلفه‌های دیگر، از جمله خودش، ارسال کند! این معماری مبتنی بر مؤلفه، همراه با قدرت و سرعت فلش Gemini 2.0، امکان ایجاد یک سیستم سریع و انعطاف پذیر را فراهم می کند که قادر به انجام وظایف مختلف است.

برنامه نویسی بصری هوش مصنوعی کامپیوتر tldraw با متن ژن با استفاده از Gemini 2.0 و تولید تصویر با مدل نسل تصویر

در اینجا نحوه نمونه سازی Gemini 2.0 Flash این تجربه را تقویت کرده است:


  • اجرای روش لایتنینگ سریع: Gemini 2.0 Flash به سرعت رویه ها را اجرا می کند. به عنوان مثال، یک جزء "دستورالعمل" ممکن است حاوی "نوشتن یک تبلیغ کوتاه" باشد. در چند لحظه پس از راه اندازی، مولفه یک اسکریپت قابل استفاده مجدد از مراحل ایجاد می کند که می تواند هر ترکیبی از ورودی ها را به یک اسکریپت تجاری تبدیل کند. سپس مؤلفه از این اسکریپت، همراه با ورودی‌های فعلی خود (مثلاً یک مؤلفه «متن» با «دستکش هوشمند جدید با هوش مصنوعی برای گربه‌ها») استفاده می‌کند تا برای خروجی نهایی آن، درخواست دوم را به مدل بدهد. این خروجی ممکن است به یکی دیگر از مؤلفه‌های «متن» پیوندی برای نمایش داده شود، و همچنین سایر مؤلفه‌های متصل، مانند «گفتار» برای تبدیل متن به گفتار، «تصویر» برای تولید بصری، یا سایر مؤلفه‌های «دستورالعمل» برای تغییر شکل بیشتر.

  • زمینه‌های زیاد، حالت‌های بسیار: بیشینه‌گرایی در رایانه tldraw خواستار سرعت، ظرفیت و قابلیت بود. با چندین مؤلفه ارائه داده‌ها برای هر نسل، پنجره زمینه بزرگ Gemini 2.0 Flash برای تولید خروجی‌هایی که همه ورودی‌ها را در نظر می‌گرفت، حیاتی بود، همانطور که پشتیبانی آن از تصاویر و فایل‌ها در کنار درخواست‌های نوشته شده بود.

  • داده های ساختاریافته: جریان داده ها بین مؤلفه ها بدون پایبندی به یک طرح واحد امکان پذیر نخواهد بود. خروجی JSON ساختاریافته Gemini 2.0 Flash تضمین می‌کند که هر مؤلفه در یک گردش کار می‌تواند داده‌ها را از هر نوع تشخیص دهد و خروجی‌های خود را در همان ساختار تولید کند، از توقف، هموارسازی اجرا و اطمینان از تکمیل قابل اعتماد گردش‌های کاری بزرگ جلوگیری می‌کند.

  • تولید رویه پویا: فراتر از اجرای رویه های از پیش تعریف شده، Gemini 2.0 Flash می تواند رویه ها را به صورت پویا تولید کند. کاربر می‌تواند «ایجاد یک کمپین بازاریابی بر اساس این توضیحات محصول» را وارد کند، و Gemini 2.0 Flash مراحل لازم (رویه‌ها) و اجزای مورد نیاز را ایجاد می‌کند و یک گردش کار بر روی بوم بر اساس درخواست سطح بالای کاربر ایجاد می‌کند. این نسل پویا پتانسیل فوق‌العاده‌ای را برای تجربه‌های کاربر نوآورانه و جریان‌های کاری کارآمد باز می‌کند.

یک پیروزی سریع برای نوآوری

پیاده‌سازی سریع رایانه توسط tldraw ارزش پیشنهادی Gemini را برای استارت‌آپ‌ها برجسته می‌کند: نمونه‌سازی سریع، تجربه کاربری پیشرفته از طریق رابط‌های زبان طبیعی بصری، و مدیریت کارآمد داده‌های ساختاریافته به لطف مدل‌هایی مانند Gemini 2.0 Flash. این ترکیب به تیم‌های کوچک قدرت می‌دهد تا ویژگی‌های خلاقانه و مبتنی بر هوش مصنوعی را سریع و مقرون‌به‌صرفه ایجاد کنند.

ما می‌خواهیم نشان دهیم که هر تیمی می‌تواند پروژه‌های بلندپروازانه‌ای را با SDK canvas tldraw بسازد. Gemini Flash یک موتور عالی برای یک ابزار گردش کار سریع، چند وجهی �� م��تنی بر ب��م بو��. با Gemini 2.0 و شاید نامی بهتر، مطمئنم که فردا می‌توانیم رایانه را به عنوان راه‌اندازی خودش معرفی کنیم.»

- استیو رویز، بنیانگذار tldraw

برنامه خود را با API Gemini تقویت کنید

از موفقیت tldraw الهام گرفته اید؟ Gemini API مدل‌های قدرتمندی مانند Gemini 1.5 Pro، Gemini 1.5 Flash، و اکنون Gemini 2.0 Flash را به عنوان یک مدل پیش‌نمایش آ��مایشی ارائه می‌کند تا ویژگی‌های خلاقانه هوش مصنوعی را به برنامه شما بیاورد. اسناد Gemini API را کاوش کنید و به کاربران خود با هوش مصنوعی قدرت دهید.

برای متخصصان خلاق، توسعه دهندگان و تیم های مختلف، tldraw یک پلت فرم منحصر به فرد و قدرتمند برای زنده کردن ایده ها ارائه می دهد. به لیست انتظار کامپیوتر بپیوندید . آینده همکاری بصری را امروز تجربه کنید.

تونسوترا

استفاده از توانایی‌های ترجمه چندزبانه متنی Gemini 2.0 برای دسترسی به کمیک‌ها و وب‌تون‌ها برای مخاطبان در هند در سراسر زبان‌های منطقه‌ای.