https://www.zaobao.com.sg/lifestyle/tech-science/story20240609-3750157
2024-06-09
冯俊源
生成式人工智能来势汹汹,ChatGPT的关注度居高不下。工欲善其事必先利其器,要让AI生成的答案符合需求,输入明确提示至关重要。作者利用新加坡政府科技局《提示工程手册》提供的CO-STAR框架六大要点,示范怎么跟AI有效对话。
生成式人工智能(Generative Artificial Intelligence)自OpenAI于2022年底推出ChatGPT服务后,成了街头巷尾的热门议题,各行各业都面对冲击。虽然人工智能的发展在ChatGPT之前已有六七十年历史,由于硬体和演算法的局限,生成式AI只能在客观条件成熟后蔚然成风。
生成式AI通过分析文本、影像等数以亿计的大数据,以机器学习(machine Learning)的方式来产生用户指定的内容。元朝戏曲《琵琶记》:“十年寒窗无人问,一举成名天下知”,古代文人苦读诸子百家、四书五经,十年才能赴京考试。今日,我们只要手指轻轻一点,ChatGPT就能写出脉络清晰的答案。
ChatGPT聊天程序依赖其大语言模型(Large Language Model, LLM),比如GPT-3、GPT-4和近日的GPT-4o,通过单词或单词标记训练来学习人类可以理解的自然语言。为提高这些语言模型的输出成果,学者们提出“提示工程”(Prompt Engineering)来系统化地描述用户的任务和需求。简单来说,通过一系列中间步骤和提示,用户能“鼓励”或“禁止”LLM思考及推理的方向。好比学校老师在设计一道有难度的考题时,以多个小题来引导学生解题的方向。有效的提示对于成果至关重要。
新加坡政府科技局(GovTech)的数据科学与AI团队于2023年刊登《提示工程手册》(Prompt Engineering Playbook ),主旨在帮助国人通过提示工程与以LLM驱动的人工智能沟通交流。手册里也提出CO-STAR框架,本文简单扼要地介绍其六大要点,以构建及撰写有效的提示。
ChatGPT最新大预言模型GPT-4o (粉红色)在语言处理的表现,在大部分的指标中排行第一。(OpenAI)
CO-STAR是六个英文字的缩写,包含提示工程的六大要素:背景(Context)、目标(Objective)、风格(Style)、语气(Tone)、受众(Audience)及回应(Response)。通过明确提示,人工智能将能以更大概率提供符合需求的答案。下文以案例逐一介绍及演示这六大要素。
比如我想写一篇关于“太阳能发电”的文章,在ChatGPT平台上测试。
用户:写一篇关于太阳能发电的文章。
ChatGPT:太阳能发电,是指通过将太阳能转化为电能的一种可再生能源技术……
ChatGPT洋洋洒洒地写了1000多字。虽然言之有物,但是输出的文章未必符合用户需要,内容也过于平淡无奇,与在谷歌的搜索记录没两样。
背景 Context
为了帮助生成式AI了解有关课题,我们可以提供背景资料、原因或处境。生成的结果会更加切题。
用户:写一篇关于太阳能发电的文章。内容针对太阳能在新加坡近10年的发展、就业前景和科研发展。
ChatGPT:新加坡作为一个高度都市化且缺乏自然资源的国家,一直致力于探索可持续发展的能源解决方案……
生成式AI的答案更符合用户的需求,内容集中于新加坡的太阳能科研和就业市场。
目标 Objective
所谓“读书破万卷,下笔如有神”,生成式AI经过模型训练后,还得言之有物,不能离题。因此,我们在提示中加入写作的主旨和目标,生成结果才不会过于泛化。比如,我们是想问一道问题,还是写一则脸书帖子?
用户:写一篇关于太阳能发电的文章。目标是说服石油和天然气公司停止开采化石燃料,转而研究替代能源。
ChatGPT:全球气候变化的加剧和环境污染的严重性,迫使我们重新审视传统化石燃料的使用。作为全球能源供应的重要组成部分……
生成的文章会紧扣用户需求。当然,今日的生成式AI机器人仍可能产生“幻觉”(hallucination),细节仍有虚假或者是误导性的资讯。
风格 Style
作家们的写作风格都自成一派,生成式AI能在用户的提示下,可模仿指定作家名人甚至职业的写作或演讲风格。在提示工程里,风格的拿捏十分重要,成功的风格可以让生成结果更加突出,符合用户需要。
用户:参考一个喜剧演员的写作风格,写一篇关于太阳能发电的文章。
ChatGPT:各位朋友们,今天我们要聊聊太阳能发电!对,没错,就是那个给我们带来阳光、晒黑皮肤和晒干洗衣服的超级明星……
风格的设定,能让结果的客制化事半功倍。读者可尝试以旅游顾问、教师等职业发问,或者想要某种类型的答案,就让生成式AI随机应变吧!然而,文中的“洗衣服”,用“湿衣服”比较合适。这也凸显了机器人目前的局限性。
语气 Tone
人工智能中“人”的要素大多由语气体现出来。在预定设置下,生成式AI的答案多为中立、八股的。如果在提示里指定语气,答案会变成正经八百或幽默风趣。语气的冷暖变化,更能与受众产生情感上的共鸣。
用户:从一名家庭主妇的角度,以跟孩子说话的语气,写一篇关于太阳能发电的文章。
ChatGPT:孩子们,今天妈妈要跟你们聊聊一种神奇的东西,叫做太阳能发电。你们知道吗?每天早上我们起床,太阳公公就已经在天空中微笑了……
除了妈妈的口吻,AI还能摇身一变,套用客气、幽默,或是有同情心的说法来生成答案。
受众 Audience
生成式AI能够根据受众的背景,选择受众能够容易理解的词汇。比如说,提示里如果写文章的受众是专业人士,生成结果就会用特有名词和术语;反之,写给幼童的生成文章会浅白易懂,正如白居易的诗歌一样。
用户:写一篇关于太阳能发电的文章,读者是三到五岁的学前幼童。
ChatGPT:每天早上,我们睁开眼睛,太阳公公就会从天空中升起来,给我们带来光和温暖。你们知道吗?太阳公公还有一个特别厉害的魔法,它可以帮助我们发电……
回应 Response
提示工程里的最后一个要点是回应的格式和文长。格式包括散文、社交帖子,甚至是诗歌,LLM能够按照具体需求生成答案。此外,格式能以多种形式输出,比如列表、文档、报告等。
用户:以七言绝句的格式,写一篇关于太阳能发电的文章。
ChatGPT:天上明珠光万丈,人间屋顶电流长。清风伴日无尘染,万户千家享太阳。
生成的诗抑扬顿挫,平仄整齐,颇有唐诗的韵味。
No comments:
Post a Comment