0%

2023:

1 在为迎接小宝宝积极准备
2 公司的项目还在积极推进

2024:

0 接代,迎接小宝宝的到来,适应家庭新成员
0 立足,找到目前工作所需方法论体系,完善技能,形成体系
1 屯粮,删减不在预算内的非必要开支
2 开源,开辟非主营业务收入途径,还是尽量能开辟副业
3 比赛,继续跟进kaggle比赛,遇到感兴趣的项目可以参与一下
4 编码,定向编程题刷到1000左右,学一下RUST,打好基础,做点产出
5 英语,词汇量积累到9000左右,并有计划的增强听说能力
6 博客,不一定要有数量,一定要有必要质量
7 数学,继续强化数学,微分、积分、级数、矩阵、概率。有一本线性代数的几何应用读透
8 阅读,计算机(5)/前沿(3)/人文社会历史(2) 读读论文
9 锻炼,嗯

OpenAI

2021 openai 有大批成员出走。

GPT/GPT-2/GPT-3

根据少量文本输入,生成可信的续接文本。
都不开源,只能通过商业API访问

GPT-3 集成

● Power Apps用户可以描述程序目标然后自动转换成Power Fx代码
● GitHub用户可以在代码编辑器中调用Codex生成代码片段或者整个函数
有超过300个App基于GPT-3进行创建,OpenAI启动了1亿美元的基金,用于投资使用了他们的API的公司。

CLIP

image
多模态+自监督+大数据集
使用400M 文本-图像数据对学习图像文本表示;无需fine-tuning就能够在各种任务中表现出稳定的性能。

DALL-E/DALL-E 2

image
120亿的参数量
创建链接视觉和语言的多模态模型,迈向通用人工智能。
将 文本-图像对视为生成任务,基于自然语言提示生成可信的图片。
基于1280的文本图像token进行自回归建模。
为了得到更好的结果,研究人员使用CLIP对32个最好的图片结果进行了重排。
https://openai.com/dall-e-2/

Codex

是GPT-3 的一个具体应用。可以将自然语言翻译成几十种编程语言中的功能代码。
● 在将问题分解为可管理的较小问题后,开发人员可以调用Codex,自动将这些问题映射到现有代码(库、API或函数)。
● Codex支持理解查询的上下文,可以保留之前的查询,以便在新查询中更有效地推理。
● 使用GPT-3的自然语言数据集以及从GitHub等公共来源检索的数十亿行源代码进行训练。

它可以生成代码片段,但无法生成整个程序。
image
虽然它比其它的模型表现更好,但在 中/难 测试中准确率不超过 5%。

Reference

https://forum.effectivealtruism.org/posts/BNQMyWGCNWDdP2WyG/2021-ai-alignment-literature-review-and-charity-comparison

今年的总结不能copy去年的了 +_+

2021:

1 经历了一次小事故
2 跟心爱的人结婚啦
3 又换工作啦 -_-
4 写了个完整的小项目(虽然没啥用)
5 做了一个kaggle项目,也算失败了
6 参加了一次学术研讨会
7 跟博士硕士一起讨论暂时没啥代沟,但需要加强学习

2022:

0 立足,找到目前工作所需方法论体系,完善技能,形成体系
1 屯粮,删减不在预算内的非必要开支
2 开源,开辟非主营业务收入途径,还是尽量能开辟副业
3 比赛,继续跟进kaggle比赛,遇到感兴趣的项目可以参与一下
4 编码,定向编程题刷到1000左右,学一下RUST,打好基础,做点产出
5 英语,词汇量积累到9000左右,并有计划的增强听说能力
6 博客,不一定要有数量,一定要有必要质量
7 数学,继续强化数学,微分、积分、级数、矩阵、概率。有一本线性代数的几何应用读透
8 阅读,计算机(5)/前沿(3)/人文社会历史(2) 读读论文
9 锻炼,嗯