Fix typo (#1117)

bjzhjing · web-flow · commit f7a7f8aa3f8a · 2024-11-12T09:54:05.000+08:00
Signed-off-by: Cathy Zhang &lt;cathy.zhang@intel.com&gt;
diff --git a/ChatQnA/benchmark/performance/kubernetes/intel/gaudi/README.md b/ChatQnA/benchmark/performance/kubernetes/intel/gaudi/README.md
@@ -100,12 +100,12 @@ python deploy.py --uninstall
 #### Case 2: Baseline Deployment without Rerank
 
 ```bash
-python deploy.py --hftoken $HFTOKEN --modeldir $MODELDIR --num-nodes 2
+python deploy.py --hf-token $HFTOKEN --model-dir $MODELDIR --num-nodes 2
 ```
 #### Case 3: Tuned Deployment with Rerank
 
 ```bash
-python deploy.py --hftoken $HFTOKEN --modeldir $MODELDIR --num-nodes 2 --with-rerank --tuned
+python deploy.py --hf-token $HFTOKEN --model-dir $MODELDIR --num-nodes 2 --with-rerank --tuned
 ```
 
 ## Benchmark
diff --git a/ChatQnA/benchmark/performance/kubernetes/intel/gaudi/generate_helm_values.py b/ChatQnA/benchmark/performance/kubernetes/intel/gaudi/generate_helm_values.py
@@ -99,7 +99,7 @@ def generate_helm_values(with_rerank, num_nodes, hf_token, model_dir, node_selec
             },
             {"name": "teirerank", "resources": {"limits": {"habana.ai/gaudi": 1}}} if with_rerank else None,
             {"name": "tgi", "resources": {"limits": {"habana.ai/gaudi": 1}}},
-            {"name": "retriever", "resources": {"requests": {"cpu": "8", "memory": "8000Mi"}}},
+            {"name": "retriever-usvc", "resources": {"requests": {"cpu": "8", "memory": "8000Mi"}}},
         ]
 
         # Filter out any None values directly as part of initialization

Original file line number	Diff line number	Diff line change
`@@ -99,7 +99,7 @@ def generate_helm_values(with_rerank, num_nodes, hf_token, model_dir, node_selec`
`99`	`99`	`},`
`100`	`100`	`{"name": "teirerank", "resources": {"limits": {"habana.ai/gaudi": 1}}} if with_rerank else None,`
`101`	`101`	`{"name": "tgi", "resources": {"limits": {"habana.ai/gaudi": 1}}},`
`102`		`- {"name": "retriever", "resources": {"requests": {"cpu": "8", "memory": "8000Mi"}}},`
	`102`	`+ {"name": "retriever-usvc", "resources": {"requests": {"cpu": "8", "memory": "8000Mi"}}},`
`103`	`103`	`]`
`104`	`104`
`105`	`105`	`# Filter out any None values directly as part of initialization`