2023总结暨2024规划

Posted on 2024-01-01 Edited on 2023-12-31 In 个人

2023:

1 在为迎接小宝宝积极准备
2 公司的项目还在积极推进

2024:

0 接代，迎接小宝宝的到来，适应家庭新成员
0 立足，找到目前工作所需方法论体系，完善技能，形成体系
1 屯粮，删减不在预算内的非必要开支
2 开源，开辟非主营业务收入途径，还是尽量能开辟副业
3 比赛，继续跟进kaggle比赛，遇到感兴趣的项目可以参与一下
4 编码，定向编程题刷到1000左右，学一下RUST，打好基础，做点产出
5 英语，词汇量积累到9000左右，并有计划的增强听说能力
6 博客，不一定要有数量，一定要有必要质量
7 数学，继续强化数学，微分、积分、级数、矩阵、概率。有一本线性代数的几何应用读透
8 阅读，计算机(5)/前沿(3)/人文社会历史(2) 读读论文
9 锻炼，嗯

NLP | 句子嵌入

Posted on 2022-05-22 Edited on 2023-12-31 In 学习

SBERT

OpenAI调研

Posted on 2022-04-12 Edited on 2023-12-31 In 调研

OpenAI

2021 openai 有大批成员出走。

GPT/GPT-2/GPT-3

根据少量文本输入，生成可信的续接文本。
都不开源，只能通过商业API访问

GPT-3 集成

● Power Apps用户可以描述程序目标然后自动转换成Power Fx代码
● GitHub用户可以在代码编辑器中调用Codex生成代码片段或者整个函数
有超过300个App基于GPT-3进行创建，OpenAI启动了1亿美元的基金，用于投资使用了他们的API的公司。

CLIP

多模态+自监督+大数据集
使用400M 文本-图像数据对学习图像文本表示；无需fine-tuning就能够在各种任务中表现出稳定的性能。

DALL-E/DALL-E 2

120亿的参数量
创建链接视觉和语言的多模态模型，迈向通用人工智能。
将文本-图像对视为生成任务，基于自然语言提示生成可信的图片。
基于1280的文本图像token进行自回归建模。
为了得到更好的结果，研究人员使用CLIP对32个最好的图片结果进行了重排。
https://openai.com/dall-e-2/

Codex

是GPT-3 的一个具体应用。可以将自然语言翻译成几十种编程语言中的功能代码。
● 在将问题分解为可管理的较小问题后，开发人员可以调用Codex，自动将这些问题映射到现有代码（库、API或函数）。
● Codex支持理解查询的上下文，可以保留之前的查询，以便在新查询中更有效地推理。
● 使用GPT-3的自然语言数据集以及从GitHub等公共来源检索的数十亿行源代码进行训练。

它可以生成代码片段，但无法生成整个程序。

虽然它比其它的模型表现更好，但在中/难测试中准确率不超过 5%。

Reference

https://forum.effectivealtruism.org/posts/BNQMyWGCNWDdP2WyG/2021-ai-alignment-literature-review-and-charity-comparison

2021总结暨2022规划

Posted on 2022-01-01 In 个人

今年的总结不能copy去年的了 +_+

2021:

1 经历了一次小事故
2 跟心爱的人结婚啦
3 又换工作啦 -_-
4 写了个完整的小项目（虽然没啥用）
5 做了一个kaggle项目，也算失败了
6 参加了一次学术研讨会
7 跟博士硕士一起讨论暂时没啥代沟，但需要加强学习

2022:

0 立足，找到目前工作所需方法论体系，完善技能，形成体系
1 屯粮，删减不在预算内的非必要开支
2 开源，开辟非主营业务收入途径，还是尽量能开辟副业
3 比赛，继续跟进kaggle比赛，遇到感兴趣的项目可以参与一下
4 编码，定向编程题刷到1000左右，学一下RUST，打好基础，做点产出
5 英语，词汇量积累到9000左右，并有计划的增强听说能力
6 博客，不一定要有数量，一定要有必要质量
7 数学，继续强化数学，微分、积分、级数、矩阵、概率。有一本线性代数的几何应用读透
8 阅读，计算机(5)/前沿(3)/人文社会历史(2) 读读论文
9 锻炼，嗯