Հրահանգների ինժեներիա
Հրահանգների ինժեներիա, կամ հրամանների ճարտարագիտություն, հրահանգի կառուցման գործընթաց, որը կարող է մեկնաբանվել և հասկացվել գեներատիվ արհեստական բանականության (AI) մոդելի կողմից[1][2]։
Հրահանգը բնական լեզվով տեքստ է, որը նկարագրում է այն առաջադրանքը, որը պետք է կատարի արհեստական բանականությունը[3]։ Լեզվի մոդելի հրահանգը կարող է լինել այնպիսի հարցում, ինչպիսին է «ինչ է Ֆերմայի փոքրիկ թեորեմը»[4], կամ՝ «գրիր բանաստեղծություն Էդգար Ալան Պոյի ոճով տերևների անկման մասին»[5], կամ կարող է լինել ավելի երկար տեքստ, ներառյալ հրահանգները[6], և լեզվի մոդելի հետ խոսակցության պատմությունը: Հրահանգների ճարտարագիտությունը կարող է ներառել հարցման ձևակերպում ոճի հստակեցման[5], բառերի և քերականության ընտրության[7], համապատասխան համատեքստի տրամադրման[8] վերաբերյալ։ ԱԲ-ին կարելի է նաև այնպիսի դեր հատկացնելը, ինչպիսին է «բնիկ ֆրանսախոսը»[9]։
Տեքստից-պատկեր կամ տեքստից-աուդիո մոդելի հետ շփվելիս հրահանգը ցանկալի արդյունքի նկարագրությունն է, ինչպիսին է օրինակ «ձի հեծած տիեզերագնացի լուսանկար»[10] կամ «Lo- fi դանդաղ երաժշտություն»[11]։
Պատմություն
[խմբագրել | խմբագրել կոդը]2022 թվականին Google-ի հետազոտողները առաջարկել են մտքի շղթայի հրահանգների տեխնիկան[12][13]։
2023 թվականին տեքստից տեքստ և տեքստից պատկեր հրահանգների տվյալների բազաները հասանելի դարձան հանրությանը[14][15]։
Տեքստից տեքստ
[խմբագրել | խմբագրել կոդը]Ըստ 2024 թվականի ուսումնասիրության՝ հրապարակվել են առնվազն 29 հրահանգների ինժեներայի տեխնիկա[16]։
Մտքի շղթա
[խմբագրել | խմբագրել կոդը]Ըստ Google-ի գործադիր տնօրեն Սունդար Պիչայի, մտքի շղթայի (CoT) հրահանգը մի տեխնիկա է, որը թույլ է տալիս մեծ լեզվական մոդելներին քայլ առ քայլ լուծել խնդիրները[17], նախքան վերջնական պատասխան տալը: 2022 թվականին Google-ի հետազոտող թիմը հայտարարել է, որ «մտքի շղթայի» հրահանգը (chain-of-thought prompting) բարելավում է լեզվական մոդելի բանականության ունակությունը՝ ստիպելով նրան քայլ առ քայլ լուծել բազմափուլ խնդիրները[17][12][18]։ Մտքի շղթայի տեխնիկան թույլ է տալիս լեզվական մեծ մոդելներին հաղթահարել որոշ տրամաբանական առաջադրանքների հետ կապված դժվարությունները, որոնք պահանջում են տրամաբանական մտածողություն, օրինակ՝ թվաբանական հարցերը[19][20][21]։
Օրինակ՝ Google-ը պնդում է, որ «Ճաշարանում կար 23 խնձոր: Եթե 20-ը օգտագործվել է ճաշ պատրաստելու համար և գնվել է ևս 6-ը, քանի՞ խնձոր կա» հարցին պատասխանելիս լեզվական մոդելը կպատասխանի «Սրճարանում ի սկզբանե կար 23 խնձոր: 20-ը օգտագործվել է ճաշ պատրաստելու համար։ Ուրեմն կա 23-20 = 3 խնձոր։ Գնվել է 6 խնձոր։ Ուստի կա 3 + 6 = 9 խնձորն: Կա 9 խնձոր»[12]։
CoT հրահանգի օրինակ՝ [22]
Հարց։ {հարց} Պատասխան։ Եկեք մտածենք քայլ առ քայլ:
Ինչպես ի սկզբանե ստեղծվել էր Google-ի կողմից[12], յուրաքանչյուր CoT հրահանգ ներառում էր մի քանի հարցուպատասխանի օրինակներ։ Ըստ Google-ի և Տոկիոյի համալսարանի հետազոտողների, պարզապես «Եկեք մտածենք քայլ առ քայլ» բառերը ավելացնելով[22] նույնպես կարելի է ստանալ արդյունավետ պատասխան[23]։
Գիտելիքի հրահանգ
[խմբագրել | խմբագրել կոդը]Գիտելիքի հրահանգը սկզբում հրահանգում է մոդելին գեներացնել համապատասխան փաստեր հրահանգը կատարելու համար, այնուհետև կատարում է հրահանգը[24]։ Ըստ 2022 թվականի հոդվածի՝ [24] պատասխանների արդյունավետությունը կարող է ժամանակի ընթացքում նվազել, եթե ներկայացվում է ավելի մեծ քանակով ինֆորմացիա:
Օրինակ՝ [24]
Գեներացրեք որոշակի գիտելիքներ մուտքագրված հասկացությունների վերաբերյալ: Մուտքագրում՝ {հարց} Գիտելիքներ:
Տեքստից-պատկեր
[խմբագրել | խմբագրել կոդը]
2022 թվականին հանրությանը թողարկվեցին տեքստից-պատկերի մոդելները, ինչպիսիք են DALL-E 2-ը, Stable Diffusion-ը և Midjourney-ն[25]։ Այս մոդելները կարդում են տեքստային հրահանգները և արհեստական բանականության միջոցով պատկերներ են ստեղծում: Տեքստից-պատկեր մոդելները սովորաբար չեն հասկանում լեզվի քերականությունը և նախադասության կառուցվածքը այնպես, ինչպես մեծ լեզվական մոդելները[26], և պահանջում են հրահանգների այլ տեխնիկա:
Հրահանգի ձևաչափեր
[խմբագրել | խմբագրել կոդը]Տեքստից պատկերի հրահանգը սովորաբար ներառում է պատկերի նկարագրությունը (օրինակ՝ վառ նարնջագույն կակաչներ ), ցանկալի ձևը (օրինակ՝ թվային նկարչությունը կամ լուսանկարչությունը ), ոճը (օրինակ՝ հիպերռեալիստական կամ փոփ-արտ ), լուսավորությունը և գույնը[27]։
Midjourney օգտագործելի խրախուսվում են կարճ, նկարագրական հրահանգերը. «Ցույց տուր ինձ շատ ծաղկող Կալիֆորնիայի կակաչների նկար, դրանք դարձրու պայծառ, վառ նարնջագույն և նկարիր նկարազարդ ոճով գունավոր մատիտներով»-ի փոխարեն ավելի արդյունավետ հրահանգը կլինի «Վառ նարնջագույն Կալիֆորնիայի կակաչները նկարված են գունավոր մատիտներով»[26]։
Բառերի դասավորությունը ազդում է տեքստից պատկերի հրահանգի արդյունքի վրա: Հրահանգի սկզբում գտնվող բառերը կարող ավելի շատ են շեշտադրվում[1]։
Ոճեր
[խմբագրել | խմբագրել կոդը]Որոշ տեքստից պատկերի մոդելներ կարող են ընդօրինակել կոնկրետ նկարիչների ոճը: Օրինակ՝ Գրեգ Ռուտկովսկու ոճով արտահայտությունն կարող է օգտագործվել Stable Diffusion և Midjourney հրահանգներում՝ լեհ թվային նկարիչ Գրեգ Ռուտկովսկու ոճովպատկերներ ստեղծելու նպատակով[28]։
Բացասական հրահանգներ
[խմբագրել | խմբագրել կոդը]Տեքստից-պատկեր մոդելները սովորականի պես չեն հասկանում բացառումները: «Խնջույք առանց տորթի» հրահանգը հավանաբար կստեղծի պատկեր, որը տորթ է ներառում[26]։ Բացասական հրահանգները թույլ են տալիս օգտվողին առանձին հրամանով նշել, թե որ տերմինները չպետք է հայտնվեն ստացված պատկերում[29]։
Ոչ տեքստային հրամաններ
[խմբագրել | խմբագրել կոդը]Պատկերային հրամաններ
[խմբագրել | խմբագրել կոդը]2023 թվականին Meta-ի ԱԲ հետազոտական թիմը թողարկեց Segment Anything համակարգչային տեսլական մոդելը, որը հրամաններով կարող է կատարել պատկերի հատվածավորում[30]։
Ծանոթագրություններ
[խմբագրել | խմբագրել կոդը]- ↑ 1,0 1,1 Diab, Mohamad; Herrera, Julian; Chernow, Bob (2022-10-28). «Stable Diffusion Prompt Book» (PDF). Վերցված է 2023-08-07-ին. «Prompt engineering is the process of structuring words that can be interpreted and understood by a text-to-image model. Think of it as the language you need to speak in order to tell an AI model what to draw.»
- ↑ Ziegler, Albert; Berryman, John (17 July 2023). «A developer's guide to prompt engineering and LLMs». The GitHub Blog. «Prompt engineering is the art of communicating with a generative AI model.»
- ↑ Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilya (2019). «Language Models are Unsupervised Multitask Learners» (PDF). OpenAI. «We demonstrate language models can perform down-stream tasks in a zero-shot setting – without any parameter or architecture modification»
- ↑ «Introducing ChatGPT». OpenAI Blog. 2022-11-30. Վերցված է 2023-08-16-ին. «what is the fermat's little theorem»
- ↑ 5,0 5,1 Robinson, Reid (August 3, 2023). «How to write an effective GPT-3 or GPT-4 prompt». Zapier. Վերցված է 2023-08-14-ին. «"Basic prompt: 'Write a poem about leaves falling.' Better prompt: 'Write a poem in the style of Edgar Allan Poe about leaves falling.'»
- ↑ Gouws-Stewart, Natasha (June 16, 2023). «The ultimate guide to prompt engineering your GPT-3.5-Turbo model». masterofcode.com.
- ↑ Wahle, Jan Philip; Ruas, Terry; Xu, Yang; Gipp, Bela (2024). «Paraphrase Types Elicit Prompt Engineering Capabilities». In Al-Onaizan, Yaser; Bansal, Mohit; Chen, Yun-Nung (eds.). Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. Miami, Florida, USA: Association for Computational Linguistics. էջեր 11004–11033. doi:10.18653/v1/2024.emnlp-main.617.
- ↑ Greenberg, J., Laura (31 May 2023). «How to Prime and Prompt ChatGPT for More Reliable Contract Drafting Support». contractnerds.com. Վերցված է 24 July 2023-ին.
- ↑ «GPT Best Practices». OpenAI. Վերցված է 2023-08-16-ին.
- ↑ Heaven, Will Douglas (April 6, 2022). «This horse-riding astronaut is a milestone on AI's long road towards understanding». MIT Technology Review. Վերցված է 2023-08-14-ին.
- ↑ Wiggers, Kyle (2023-06-12). «Meta open sources an AI-powered music generator». TechCrunch. Վերցված է 2023-08-15-ին. «Next, I gave a more complicated prompt to attempt to throw MusicGen for a loop: "Lo-fi slow BPM electro chill with organic samples."»
- ↑ 12,0 12,1 12,2 12,3 Wei, Jason; Wang, Xuezhi; Schuurmans, Dale; Bosma, Maarten; Ichter, Brian; Xia, Fei; Chi, Ed H.; Le, Quoc V.; Zhou, Denny (31 October 2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. Advances in Neural Information Processing Systems (NeurIPS 2022) (անգլերեն). Vol. 35. arXiv:2201.11903.Wei, Jason; Wang, Xuezhi; Schuurmans, Dale; Bosma, Maarten; Ichter, Brian; Xia, Fei; Chi, Ed H.; Le, Quoc V.; Zhou, Denny (October 31, 2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. Advances in Neural Information Processing Systems (NeurIPS 2022). Vol. 35. arXiv:2201.11903.
- ↑ Wei, Jason; Zhou (11 May 2022). «Language Models Perform Reasoning via Chain of Thought». ai.googleblog.com (անգլերեն). Վերցված է 10 March 2023-ին.
- ↑ Chen, Brian X. (2023-06-23). «How to Turn Your Chatbot Into a Life Coach». The New York Times.
- ↑ Chen, Brian X. (2023-05-25). «Get the Best From ChatGPT With These Golden Prompts». The New York Times (ամերիկյան անգլերեն). ISSN 0362-4331. Վերցված է 2023-08-16-ին.
- ↑ Sahoo, Pranab; Singh, Ayush Kumar (2024-02-05). «A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications». arXiv:2402.07927 [cs.AI].
- ↑ 17,0 17,1 McAuliffe, Zachary (11 March 2022). «Google's Latest AI Model Can Be Taught How to Solve Problems». CNET.
- ↑ Sharan Narang and Aakanksha Chowdhery (2022-04-04). «Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance».
- ↑ Dang, Ekta (8 February 2023). «Harnessing the power of GPT-3 in scientific research». VentureBeat. Վերցված է 10 March 2023-ին.
- ↑ Montti, Roger (13 May 2022). «Google's Chain of Thought Prompting Can Boost Today's Best Algorithms». Search Engine Journal (անգլերեն). Վերցված է 10 March 2023-ին.
- ↑ Ray, Tiernan. «Amazon's Alexa scientists demonstrate bigger AI isn't always better». ZDNET (անգլերեն). Վերցված է 10 March 2023-ին.
- ↑ 22,0 22,1 Kojima, Takeshi; Shixiang Shane Gu. «Large Language Models are Zero-Shot Reasoners». arXiv:2205.11916 [cs.CL].
- ↑ Dickson, Ben (30 August 2022). «LLMs have not learned our language — we're trying to learn theirs». VentureBeat. Վերցված է 10 March 2023-ին.
- ↑ 24,0 24,1 24,2 Liu, Jiacheng; Liu, Alisa; Lu, Ximing; Welleck, Sean; West, Peter; Le Bras, Ronan; Choi, Yejin; Hajishirzi, Hannaneh (May 2022). «Generated Knowledge Prompting for Commonsense Reasoning». Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Dublin, Ireland: Association for Computational Linguistics: 3154–3169. arXiv:2110.08387. doi:10.18653/v1/2022.acl-long.225. S2CID 239016123.
- ↑ Monge, Jim Clyde (2022-08-25). «Dall-E2 VS Stable Diffusion: Same Prompt, Different Results». MLearning.ai (անգլերեն). Վերցված է 2022-08-31-ին.
- ↑ 26,0 26,1 26,2 «Prompts». docs.midjourney.com. Վերցված է 2023-08-14-ին."Prompts". docs.midjourney.com. Retrieved August 14, 2023.
- ↑ «Stable Diffusion prompt: a definitive guide». 2023-05-14. Վերցված է 2023-08-14-ին.
- ↑ Heikkilä, Melissa (2022-09-16). «This Artist Is Dominating AI-Generated Art and He's Not Happy About It». MIT Technology Review. Վերցված է 2023-08-14-ին.
- ↑ Max Woolf (2022-11-28). «Stable Diffusion 2.0 and the Importance of Negative Prompts for Good Results». Վերցված է 2023-08-14-ին.
- ↑ Kirillov, Alexander; Mintun, Eric (2023-04-01). «Segment Anything». arXiv:2304.02643 [cs.CV].
![]() | Վիքիպահեստն ունի նյութեր, որոնք վերաբերում են «Հրահանգների ինժեներիա» հոդվածին։ |