被烹饪的数据 Cooking Data
引 大模型的好坏,与数据质量息息相关,目前的数据大多已投入模型中,如何获得优质的真实世界数据将成为长期的课题。 我平时会做一部分数据分析,喜欢人类学,明年又有可能参与非洲的研究项目。Crystal Biruk 写的…
内容包括:流行病与卫生统计、机器学习、影像组学等。
引 大模型的好坏,与数据质量息息相关,目前的数据大多已投入模型中,如何获得优质的真实世界数据将成为长期的课题。 我平时会做一部分数据分析,喜欢人类学,明年又有可能参与非洲的研究项目。Crystal Biruk 写的…
背景 根据 @dotey 的科技文章翻译 Prompt,进行微调: 中英互译 使用的是 Bob 内置的 OpenAI 自定义插件(仅借用 Bob 举例,Prompts 可用于很多软件)。 可以在角色设定部分增加 Prompt(引导词),针对特定专业领…
引 传统的疾病控制方法,如血吸虫病的大规模药物治疗(MDA),在干预队列的实施过程中,相同感染率的试点区域,干预效果有时会有很大差异。评估后,专家发现医从性可能是其中的关键影响因子。村庄的社会网络结构不…
学习 Python 的这段时间,我发现 PyCharm 和 VSCode 这样的 IDE 其实不是很适合数据科学领域的新手入门使用。有太多好用但我们使用不到的功能,Jupter Notebook 和 JupterLab 就简单很多,使用体验与 Rstudio 中的 …
全幅切片图像(Whole-slide images) 是使用特殊扫描仪扫描的高分辨率物理组织病理学图像,产生的图像具有数十亿像素。它允许科学家、研究人员和临床病理学家使用软件对感兴趣的区域进行放大。全幅切片图像查看器在…
细胞 marker 是指在一种细胞类型中高表达,而在其他类型中低表达或不表达的基因。寻找细胞 Marker 并注释是单细胞分析中重要的一环,包括 3 个步骤:自动注释(Marker-based automatic annotation)、人工注释(man…
Format-free journals 这几天在海南参会,一位期刊编辑提到了 格式自由期刊(Format-free journals),挺有趣的。传统学术期刊中,作者需要按照期刊的特定格式和排版要求准备论文,比如字体、字号、行距、引用格式…
开头是一段电视采访镜头,主持人和流行病学家讨论着未来需要注意的世界性大流行疾病,其中一位科学家认为真菌是最可怕的疾病。病毒能让我们生病,而一些真菌可以控制我们的心智,像牵线木偶一样。另外,真菌需要食物才能生存,所以它会从内部吞噬宿主,把蚂蚁的血肉,变成自己的血肉,但它并不会简单地让受害者死亡,它会通过防止腐烂的方式让傀儡活著。
This article was first published on rOpenSci – open tools for open science, Dayu has translated this English article and quotes it here. 为什么要引用? I know that every citation I get for my w…
在世界历史上,传染病的大流行由人类文明进程所带来,每一次大规模的传染病爆发又对人类文明产生极其巨大而深远的影响。传染病相当于一个破坏性试验,为我们研究一个社会的构成、文化体系、我们与自然的关系、既往…
“Prelude & Fugue No. 1 in C Major, BWV 846:Prelude”这个旋律,挺适合看书的时候听的。 Illness is the night-side of life, a more onerous citizenship. Everyone who is born holds dual citi…