Created at 1pm, Dec 29
firstbatchArtificial Intelligence
3
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
1dEPLnAQv7ehcBAyLBEA0PMWeHepwGzqCKKepH2D9qY
File Type
PDF
Entry Count
160
Embed. Model
jina_embeddings_v2_base_en
Index Type
hnsw

Language models are increasingly being deployed for general problem solving across a wide range of tasks, but are still confined to token-level, left-to-right decision-making processes during inference. This means they can fall short in tasks that require exploration, strategic lookahead, or where initial decisions play a pivotal role. To surmount these challenges, researchers introduce a new framework for language model inference, “Tree of Thoughts” (ToT), which generalizes over the popular “Chain of Thought” approach to prompting language models, and enables exploration over coherent units of text (“thoughts”) that serve as intermediate steps toward problem solving. ToT allows LMs to perform deliberate decision making by considering multiple different reasoning paths and self-evaluating choices todecide the next course of action, as well as looking ahead or backtracking when necessary to make global choices. Our experiments show that ToT significantly enhances language models’ problem-solving abilities on three novel tasks requiring non-trivial planning or search: Game of 24, Creative Writing, and Mini Crosswords. For instance, in Game of 24, while GPT-4 with chain-of-thought prompting only solved 4% of tasks, our method achieved a success rate of 74%. Code repo with all prompts: https://github.com/ysymyth/tree-of-thought-llm.

)(cid:202)(cid:302)(cid:237)(cid:740)(cid:242)(cid:301)(cid:230)(cid:343)(cid:202)(cid:231)(cid:273)(cid:302)(cid:264)(cid:740)(cid:231)(cid:270)(cid:202)(cid:294)(cid:294)(cid:242)(cid:302)(cid:264)(cid:242)(cid:349)(cid:668)(cid:740)(cid:301)(cid:202)(cid:291)(cid:273)(cid:302)(cid:264)(cid:740)(cid:407)(cid:309)(cid:343)(cid:740)(cid:202)(cid:740)(cid:231)(cid:309)(cid:270)(cid:242)(cid:343)(cid:242)(cid:302)(cid:412)(cid:740)(cid:340)(cid:202)(cid:349)(cid:349)(cid:202)(cid:264)(cid:242)(cid:667)(cid:740)(cid:740)(cid:691)(cid:667)(cid:667)(cid:667)(cid:692)(cid:740)(cid:154)(cid:270)(cid:242)(cid:740)(cid:230)(cid:242)(cid:349)(cid:412)(cid:740)(cid:231)(cid:270)(cid:309)(cid:403)(cid:231)(cid:242)(cid:740)(cid:403)(cid:349)(cid:740)(cid:639)(cid:667)
id: c02d055a611cae9d35d8b31ffe953f3f - page: 7
(cid:671)(cid:667)
id: 699ae19976a09577403f5610996e3359 - page: 7
(cid:1)(cid:302)(cid:202)(cid:294)(cid:390)(cid:399)(cid:273)(cid:302)(cid:264)(cid:740)(cid:242)(cid:202)(cid:231)(cid:270)(cid:740)(cid:231)(cid:270)(cid:309)(cid:403)(cid:231)(cid:242)(cid:740)(cid:273)(cid:302)(cid:740)(cid:237)(cid:242)(cid:356)(cid:202)(cid:403)(cid:294)(cid:669)(cid:740)(cid:740)(cid:29)(cid:270)(cid:309)(cid:403)(cid:231)(cid:242)(cid:740)(cid:638)(cid:668)(cid:740)(cid:384)(cid:270)(cid:403)(cid:294)(cid:242)(cid:740)(cid:273)(cid:302)(cid:231)(cid:309)(cid:343)(cid:340)(cid:309)(cid:343)(cid:202)(cid:412)(cid:273)(cid:302)(cid:264)(cid:740)(cid:411)(cid:270)(cid:242)(cid:740)(cid:343)(cid:242)(cid:342)(cid:361)(cid:273)(cid:343)(cid:242)(cid:237)(cid:740)(cid:242)(cid:302)(cid:237)(cid:740)(cid:349)(cid:242)(cid:302)(cid:356)(cid:242)(cid:302)(cid:231)(cid:242)(cid:349)(cid:668)(cid:740)(cid:349)(cid:242)(cid:242)(cid:301)(cid:349)(cid:740)(cid:408)(cid:309)(cid:740)(cid:294)(cid:202)(cid:231)(cid:291)(cid:740)(cid:202)(cid:740)(cid:231)(cid:294)(cid:242)(cid
id: f4654a2a3cd5592f68f1073a4dd3cd53 - page: 7
:202)(cid:343)(cid:740)(cid:231)(cid:309)(cid:302)(cid:302)(cid:242)(cid:231)(cid:412)(cid:403)(cid:309)(cid:302)(cid:740)(cid:230)(cid:242)(cid:356)(cid:384)(cid:242)(cid:242)(cid:302)(cid:740)(cid:411)(cid:270)(cid:242)(cid:740)(cid:340)(cid:202)(cid:343)(cid:202)(cid:264)(cid:343)(cid:202)(cid:340)(cid:270)(cid:349)(cid:671)(cid:740)(cid:29)(cid:270)(cid:309)(cid:403)(cid:231)(cid:242)(cid:740)(cid:639)(cid:740)(cid:309)(cid:409)(cid:263)(cid:242)(cid:343)(cid:349)(cid:740)(cid:202)(cid:302)(cid:740)(cid:273)(cid:302)(cid:356)(cid:242)(cid:343)(cid:242)(cid:349)(cid:412)(cid:273)(cid:302)(cid:264)(cid:740)(cid:340)(cid:242)(cid:343)(cid:349)(cid:340)(cid:242)(cid:231)(cid:412)(cid:403)(cid:383)(cid:242)(cid:740)(cid:230)(cid:390)(cid:740)(cid:361)(cid:349)(cid:273)(cid:302)(cid:264)(cid:740)(cid:411)(cid:270)(cid:242)(cid:740)(cid:343)(cid:242)(cid:342)(cid:361)(cid:273)(cid:343)(cid:242)(cid:237)(cid:740)(cid:242)(cid:302)(cid:237)(cid:740)(cid:349)(cid:242)(cid:302)(cid:356)(cid:2
id: 0cd6c57efeb2cf88044d95c3ad98297e - page: 7
How to Retrieve?
# Search

curl -X POST "https://search.dria.co/hnsw/search" \
-H "x-api-key: <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{"rerank": true, "top_n": 10, "contract_id": "1dEPLnAQv7ehcBAyLBEA0PMWeHepwGzqCKKepH2D9qY", "query": "What is alexanDRIA library?"}'
        
# Query

curl -X POST "https://search.dria.co/hnsw/query" \
-H "x-api-key: <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{"vector": [0.123, 0.5236], "top_n": 10, "contract_id": "1dEPLnAQv7ehcBAyLBEA0PMWeHepwGzqCKKepH2D9qY", "level": 2}'