ideogram 是一款由前 google 工程師創建的 ai 圖像生成器,已經推出了第一批升級,旨在使平台更功能性和可用性。這些升級增加了更好地匹配 stable diffusion 和 midjourney 提供的功能,並且價格吸引人。
ideogram 在二月份首次公開發佈後,迅速在 ai 愛好者中流行起來,作為 midjourney、dall-e 3 和 stable diffusion 的堅強和有能力的替代品。decrypt的測試發現,與其他知名圖像生成器相比,它在快速理解提示、文字生成能力、空間意識、提示遵循、風格的多樣性、人物和品牌生成以及整體質量方面表現出色。
升級中一個重要的新功能是“描述”,它可以分析圖像並幫助製作圖像標題;“負提示”告訴模型要避免生成哪些元素,而圖像渲染和速度控制可以平衡輸出質量與效率,以滿足那些更喜歡快速生成而不是詳細生成的用戶。後者功能模仿了 stable difussion 的 turbo 和 lcm 模型。
然而,這些升級僅適用於付費用戶。免費用戶可以獲得模型的訪問權限,但僅限於每次生成最多 25 批 4 張圖像。
渴望嘗試這些功能的用戶可以升級到每月 7 美元的“基本”計劃或每月 16 美元的“plus”選項。付費計劃還為用戶提供其他福利,如私人生成、種子控制、修補功能以及慢速模式下的無限生成。
“描述”功能是一個重要的新增功能,特別是對於基本用戶。這個助手可以對任何上傳的圖像進行詳細描述,然後可以用這些描述生成更準確或更詳細的提示,以在後續迭代中更好地匹配參考。用戶可以要求對 ideogram 的任何圖像或從本地設備上傳的圖像進行描述。
現在,ideogram 還允許用戶在三種渲染選項之間切換:快速、默認和質量。快速模式優先考慮速度,大約在五秒內生成圖像,而質量模式則優先考慮更精細的細節,在大約 20 秒內生成圖像。
與此同時,“負提示”功能擴展了 ideogram 的編輯能力。這個工具讓用戶指定在生成的圖像中不希望看到的元素,提供更多對輸出的控制。這是一個特別有用的功能,可用於精煉文本到圖像生成的結果,實現第一次就獲得更準確和相關的圖像。
最後,ideogram 表示已改進了其文字渲染和照片逼真度。團隊表示,該升級將錯誤率進一步降低了 15%,並聲稱評審人員更喜歡升級模型生成的圖像,比起最初版本增加了 30-50%。
ideogram 團隊在上個月的一次 discord 會議中首次宣布了這些改進,這在用戶社區中引起了早期的積極反響。
這些改進和每月7到16美元的收費階層,使得ideogram成為一個強大且具有成本效益的圖像生成ai工具。與之相比,midjourney訂閱每年介於96到1152美元之間,chatgpt plus訂閱(提供dall-e 3訪問權)每月20美元,而其他ai圖像生成器如leonardo ai和maze guru的訂閱階層在10到25美元之間。
對於不願意支付高級功能的用戶,開源的stable diffusion是免費的,提供類似的功能,至少對於擁有更強大電腦的用戶來說。
由stacy elliott和ryan ozawa編輯。