從 E 2
Dall-E 2
- 新聞連結: https://openai.com/dall-e-2/
- Hacker News評論連結: https://news.ycombinator.com/item?id=30932095
評論
我認為將這樣的東西用於色情內容可能會給社會帶來最大的好處。關於這個行業如何利用年輕和脆弱的模型,已經說了很多。廉價的自動生成圖像(以及未來的視頻)幾乎可以消除對人體模型的需求並消除相關的痛苦,不是嗎?
編輯:錯字
* 我建議閱讀它附帶的風險和限制部分,因為它非常完整: https://github.com/openai/dalle-2-preview/blob/main/system-c…
* 與 GPT-3 不同,我對該公告的解讀是,OpenAI 不打算將其商業化,並且訪問候補名單確實更多是為了測試其限制(如前所述,將其商業化將更有可能導致有趣法律先例)。根據文檔,訪問權限非常明確:( https://github.com/openai/dalle-2-preview/blob/main/system-c … )
* 幾個月前,OpenAI 發布了 GLIDE ( https://github.com/openai/glide-text2im ),它使用了類似的 AI 圖像生成方法,但可疑的是從未收到過這樣有趣的博客文章。回想起來,原因可能是“因為我們讓它過時了”。
* 公告中的圖像仍然是精選圖像,因此這是他們在非精選圖像上測試 DALL-E 1 與 DALL-E 2 的一個很好的理由。
* 挑選櫻桃是相關的,因為 AI 圖像生成仍然很慢,除非你進行可能會損害圖像質量的真正惡作劇,儘管 OpenAI 可能有更好的基礎設施來處理大型模型,正如 GPT-3 所展示的那樣。
* 似乎 DALL-E 2 有一個有趣的端點,可以鏈接回該站點以獲取帶有歸屬的示例: https ://labs.openai.com/s/Zq9SB6vyUid9FGcoJ8slucTu
一個應用程序 – 兩個世界:這是俄羅斯和烏克蘭的 TikTok
One App – Two Worlds: This Is TikTok in Russia and Ukraine
評論
引起我注意的是所謂的 USCentric 方法,因為它以英里為單位計算距離。我還想知道它是否被翻譯成俄語,以便可以與被 TikTok 欺騙的俄羅斯公民分享
這只是 21 世紀媒體更大的系統性問題的一個例子,也是人們如何消費媒體的問題。
幾乎每個平台都是這樣的,不僅僅是 TikTok。這不像 TikTok 試圖將自己展示為一個中立、公正的來源。他們的整個前提是盡快向您提供“高度策劃”的內容。問題是人們已經接受了這一點,這是正常的,它對世界造成了可怕的影響。每個人都覺得我們是有史以來最分裂的人是有原因的……從這樣的事情開始。
就烏克蘭的戰爭而言,這就像經典的二戰宣傳一樣,但由於這些天傳播 [錯誤] 信息的速度和容易程度,它變成了 11 個。
沒有比較,但我 8 年前在以色列/巴勒斯坦衝突的高峰期做了一個類似的項目,比較來自巴勒斯坦的推文和來自以色列的推文。
當您並排看到它們時,會有令人難以置信的差異。
如果有人能在更多衝突領域執行這樣的想法以提高意識,那就太好了。
京東
Jd
- 新聞連結: https://code.jsoftware.com/wiki/Jd/Overview
- Hacker News評論連結: https://news.ycombinator.com/item?id=30905662
評論
歷史可以追溯到更遠的地方,因為面向列是用數組語言構建數據庫的自然方式(製造高性能的面向行的 DBMS 基本上是不可能的)。這是因為可以將列視為每個元素都具有相同類型的向量。行對不同類型的值進行分組,而數組語言沒有像 C 結構這樣的東西來處理這個問題。在 J 中,Jd 來自 Chris Burke 的 JDB 概念驗證(announced[2] 2008,看起來像),鏈接頁面提到了 kdb+ (K) 和 Vstar (APL)。 KDB 於 1993 年首次發布,它有點出名,並在 Wikipedia 的面向列的數據庫的歷史中被提及 [3]。
[0] 公司歷史: https ://aplwiki.com/wiki/Jsoftware
[1] https://en.wikipedia.org/wiki/List_of_column-orientation_DBMSes
[2] https://code.jsoftware.com/wiki/JDB/Announcement
[3] https://en.wikipedia.org/wiki/Column-oriented_DBMS#History
關於內存使用的經驗法則:Python/Pandas(非內存映射):“在 Pandas 中,經驗法則是數據大小需要 5 到 10 倍的內存。” R(非內存映射):“粗略的經驗法則是你的 RAM 應該是數據集大小的三倍。” Jd:“一般來說,如果可用 ram 是查詢中通常使用的 cols 所需空間的 2 倍以上,則性能會很好。”
關於 CSV 閱讀,Jd 有一個快速的 CSV 閱讀器,而 J 本身沒有。我編寫了一個 Arrow 集成,使 J 能夠訪問那個快速的 CSV 閱讀器並閱讀 Parquet。
作為函數級編程的狂熱愛好者和 J 愛好者,我這麼說。我想說我非常熟悉 J 的編程範式和概念小部件和小工具(我知道動詞、名詞、副詞和連詞,並且可以適當地使用它們)。我什至記得 Nuvoc 的相當一部分。但是,與使用 R 和 tidyverse 相比(特別是,我錯過了 dplyr 和 ggplot),即使在 J 中進行最簡單的分析也是_excrutiatingly_緩慢且不方便的。例如,tidyverse CSV 閱讀器比您從 J 宇宙中獲得的任何東西都更快、更智能、更方便且信息量更大。
我喜歡矢量語言,但在這一點上,J 無法與主要的數據分析平台競爭。它不太方便,通常_慢_,低級得多,奇怪,它的圖書館狀況充其量是貧乏的。我建議學習 J,因為它會擴展你的思維,但我無法想像將它用於實際工作。
在我熟悉的其他文本到圖像算法中(您通常會看到作為 colab 筆記本傳遞的那些,人們在 Twitter 上發布輸出),基本思想是對文本進行編碼,然後嘗試製作一個與該文本編碼最大匹配的圖像。但是這種最大化通常會導致偽影——如果你要求一張日落的圖像,你通常會得到多個太陽,因為那更像日落。有很多技巧和技巧可以規範流程,使其不那麼激進,但這始終是一場艱苦的戰鬥。
在這裡,他們取而代之的是文本嵌入,使用經過訓練的模型(他們稱之為“先驗”)來預測相應的圖像嵌入——這消除了危險的最大化。然後,另一個經過訓練的模型(“解碼器”)從預測的嵌入中生成圖像。
這感覺像是一種更明智的方法,但只有通過訪問 OpenAI 擁有的巨大 CLIP 數據集和計算資源才能真正實現。