Skip to content

Commit 948e957

Browse files
authored
remaining changes for rls2.6 (#3502)
* remaining changes for rls2.6 * expression update to align with cpu-device branch
1 parent 4784d0d commit 948e957

File tree

3 files changed

+386
-354
lines changed

3 files changed

+386
-354
lines changed

docs/_static/htmls/tbl_deepspeed.html

Lines changed: 76 additions & 70 deletions
Original file line numberDiff line numberDiff line change
@@ -11,212 +11,218 @@
1111
<tr class="row-even">
1212
<td><p>LLAMA</p></td>
1313
<td><p>meta-llama/Llama-2-7b-hf</p></td>
14-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
15-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
14+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
15+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
1616
</tr>
1717
<tr class="row-odd">
1818
<td><p>LLAMA</p></td>
1919
<td><p>meta-llama/Llama-2-13b-hf</p></td>
20-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
21-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
20+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
21+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
2222
</tr>
2323
<tr class="row-even">
2424
<td><p>LLAMA</p></td>
2525
<td><p>meta-llama/Llama-2-70b-hf</p></td>
26-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
27-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
26+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
27+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
2828
</tr>
2929
<tr class="row-odd">
3030
<td><p>LLAMA</p></td>
3131
<td><p>meta-llama/Meta-Llama-3-8B</p></td>
32-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
33-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
32+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
33+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
3434
</tr>
3535
<tr class="row-even">
3636
<td><p>LLAMA</p></td>
3737
<td><p>meta-llama/Meta-Llama-3-70B</p></td>
38-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
39-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
38+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
39+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
4040
</tr>
4141
<tr class="row-odd">
4242
<td><p>LLAMA</p></td>
4343
<td><p>meta-llama/Meta-Llama-3.1-8B-Instruct</p></td>
44-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
45-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
44+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
45+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
4646
</tr>
4747
<tr class="row-even">
4848
<td><p>LLAMA</p></td>
4949
<td><p>meta-llama/Llama-3.2-3B-Instruct</p></td>
50-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
51-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
50+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
51+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
5252
</tr>
5353
<tr class="row-odd">
5454
<td><p>LLAMA</p></td>
5555
<td><p>meta-llama/Llama-3.2-11B-Vision-Instruct</p></td>
56-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
57-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
56+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
57+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
5858
</tr>
5959
<tr class="row-even">
6060
<td><p>GPT-J</p></td>
6161
<td><p>EleutherAI/gpt-j-6b</p></td>
62-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
63-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
62+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
63+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
6464
</tr>
6565
<tr class="row-odd">
6666
<td><p>GPT-NEOX</p></td>
6767
<td><p>EleutherAI/gpt-neox-20b</p></td>
68-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
69-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
68+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
69+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
7070
</tr>
7171
<tr class="row-even">
7272
<td><p>DOLLY</p></td>
7373
<td><p>databricks/dolly-v2-12b</p></td>
74-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
75-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
74+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
75+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
7676
</tr>
7777
<tr class="row-odd">
7878
<td><p>FALCON</p></td>
7979
<td><p>tiiuae/falcon-11b</p></td>
80-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
81-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
80+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
81+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
8282
</tr>
8383
<tr class="row-even">
8484
<td><p>FALCON</p></td>
8585
<td><p>tiiuae/falcon-40b</p></td>
86-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
87-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
86+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
87+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
8888
</tr>
8989
<tr class="row-odd">
9090
<td><p>OPT</p></td>
9191
<td><p>facebook/opt-30b</p></td>
92-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
93-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
92+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
93+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
9494
</tr>
9595
<tr class="row-even">
9696
<td><p>OPT</p></td>
9797
<td><p>facebook/opt-1.3b</p></td>
98-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
99-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
98+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
99+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
100100
</tr>
101101
<tr class="row-odd">
102102
<td><p>Bloom</p></td>
103103
<td><p>bigscience/bloom-1b7</p></td>
104-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
105-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
104+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
105+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
106106
</tr>
107107
<tr class="row-even">
108108
<td><p>CodeGen</p></td>
109109
<td><p>Salesforce/codegen-2B-multi</p></td>
110-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
111-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
110+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
111+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
112112
</tr>
113113
<tr class="row-odd">
114114
<td><p>Baichuan</p></td>
115115
<td><p>baichuan-inc/Baichuan2-7B-Chat</p></td>
116-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
117-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
116+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
117+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
118118
</tr>
119119
<tr class="row-even">
120120
<td><p>Baichuan</p></td>
121121
<td><p>baichuan-inc/Baichuan2-13B-Chat</p></td>
122-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
123-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
122+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
123+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
124124
</tr>
125125
<tr class="row-odd">
126126
<td><p>Baichuan</p></td>
127127
<td><p>baichuan-inc/Baichuan-13B-Chat</p></td>
128-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
129-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
128+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
129+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
130130
</tr>
131131
<tr class="row-even">
132132
<td><p>GPTBigCode</p></td>
133133
<td><p>bigcode/starcoder</p></td>
134-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
135-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
134+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
135+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
136136
</tr>
137137
<tr class="row-odd">
138138
<td><p>T5</p></td>
139139
<td><p>google/flan-t5-xl</p></td>
140-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
141-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
140+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
141+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
142142
</tr>
143143
<tr class="row-even">
144144
<td><p>Mistral</p></td>
145145
<td><p>mistralai/Mistral-7B-v0.1</p></td>
146-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
147-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
146+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
147+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
148148
</tr>
149149
<tr class="row-odd">
150150
<td><p>Mistral</p></td>
151151
<td><p>mistralai/Mixtral-8x7B-v0.1</p></td>
152-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
153-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
152+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
153+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
154154
</tr>
155155
<tr class="row-even">
156156
<td><p>MPT</p></td>
157157
<td><p>mosaicml/mpt-7b</p></td>
158-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
159-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
158+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
159+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
160160
</tr>
161161
<tr class="row-odd">
162162
<td><p>Stablelm</p></td>
163163
<td><p>stabilityai/stablelm-2-1_6b</p></td>
164-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
165-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
164+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
165+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
166166
</tr>
167167
<tr class="row-even">
168168
<td><p>Qwen</p></td>
169169
<td><p>Qwen/Qwen-7B-Chat</p></td>
170-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
171-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
170+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
171+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
172172
</tr>
173173
<tr class="row-odd">
174174
<td><p>Qwen</p></td>
175175
<td><p>Qwen/Qwen2-7B</p></td>
176-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
177-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
176+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
177+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
178178
</tr>
179179
<tr class="row-even">
180180
<td><p>GIT</p></td>
181181
<td><p>microsoft/git-base</p></td>
182-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
183-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
182+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
183+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
184184
</tr>
185185
<tr class="row-odd">
186186
<td><p>Phi</p></td>
187187
<td><p>microsoft/phi-2</p></td>
188-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
189-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
188+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
189+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
190190
</tr>
191191
<tr class="row-even">
192192
<td><p>Phi</p></td>
193193
<td><p>microsoft/Phi-3-mini-4k-instruct</p></td>
194-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
195-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
194+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
195+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
196196
</tr>
197197
<tr class="row-odd">
198198
<td><p>Phi</p></td>
199199
<td><p>microsoft/Phi-3-mini-128k-instruct</p></td>
200-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
201-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
200+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
201+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
202202
</tr>
203203
<tr class="row-even">
204204
<td><p>Phi</p></td>
205205
<td><p>microsoft/Phi-3-medium-4k-instruct</p></td>
206-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
207-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
206+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
207+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
208208
</tr>
209209
<tr class="row-odd">
210210
<td><p>Phi</p></td>
211211
<td><p>microsoft/Phi-3-medium-128k-instruct</p></td>
212-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
213-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
212+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
213+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
214214
</tr>
215215
<tr class="row-even">
216216
<td><p>Whisper</p></td>
217217
<td><p>openai/whisper-large-v2</p></td>
218-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
219-
<td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
218+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
219+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
220+
</tr>
221+
<tr class="row-odd">
222+
<td><p>DeepSeek</p></td>
223+
<td><p>deepseek-ai/DeepSeek-V2.5-1210</p></td>
224+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
225+
<td><p style="text-align: center; vertical-align: middle;"></p></td>
220226
</tr>
221227
</tbody>
222228
</table>

0 commit comments

Comments
 (0)