Merge branch 'main' into add_new_machine_type

Tmonster · Tmonster · commit 389578163a63 · 2025-01-17T12:53:11.000+01:00
diff --git a/.github/workflows/regression.yml b/.github/workflows/regression.yml
@@ -48,7 +48,7 @@ jobs:
 
     - name: Install all solutions
       shell: bash
-      run: source path.env && python3 ./_setup_utils/install_all_solutions.py ${{ matrix.solution }}
+      run: source path.env && python3 _setup_utils/install_all_solutions.py ${{ matrix.solution }}
 
     - name: Turn swap off
       shell: bash
diff --git a/R-arrow/VERSION b/R-arrow/VERSION
@@ -0,0 +1 @@
+17.0.0.1
diff --git a/_benchplot/benchplot-dict.R b/_benchplot/benchplot-dict.R
@@ -39,7 +39,7 @@ solution.dict = {list(
   "spark" = list(name=c(short="spark", long="spark"), color=c(strong="#8000FFFF", light="#CC66FF")),
   "dask" = list(name=c(short="dask", long="dask"), color=c(strong="slategrey", light="lightgrey")),
   "juliadf" = list(name=c(short="DF.jl", long="DataFrames.jl"), color=c(strong="deepskyblue", light="darkturquoise")),
-  "juliads" = list(name=c(short="IMD.jl", long="InMemoryDatasets.jl"), color=c(strong="#b80000", light="#ff1f1f")),
+  "juliads" = list(name=c(short="IMD.jl", long="InMemData.jl"), color=c(strong="#b80000", light="#ff1f1f")),
   "clickhouse" = list(name=c(short="clickhouse", long="ClickHouse"), color=c(strong="hotpink4", light="hotpink1")),
   "polars" = list(name=c(short="polars", long="Polars"), color=c(strong="deepskyblue4", light="deepskyblue3")),
   "R-arrow" = list(name=c(short="R-arrow", long="R-arrow"), color=c(strong="aquamarine3", light="aquamarine1")),
@@ -299,10 +299,12 @@ groupby.data.exceptions = {list(
                   "G1_1e8_2e0_0_0")                                                # q3
   )},
   "juliadf" = {list(
-    "timeout" = "G1_1e8_2e0_0_0",
-    "out of memory" = c("G1_1e9_1e2_0_0","G1_1e9_1e1_0_0","G1_1e9_2e0_0_0","G1_1e9_1e2_0_1","G1_1e9_1e2_5_0") # CSV.File
+    # "timeout" = "G1_1e8_2e0_0_0",
+    # "out of memory" = c("G1_1e9_1e2_0_0","G1_1e9_1e1_0_0","G1_1e9_2e0_0_0","G1_1e9_1e2_0_1","G1_1e9_1e2_5_0"), # CSV.File
+    "CSV import Segfault: JuliaLang#55765" = c("G1_1e7_1e2_0_0","G1_1e7_1e1_0_0","G1_1e7_2e0_0_0","G1_1e7_1e2_0_1","G1_1e7_1e2_5_0","G1_1e8_1e2_0_0","G1_1e8_1e1_0_0","G1_1e8_2e0_0_0","G1_1e8_1e2_0_1","G1_1e8_1e2_5_0","G1_1e9_1e2_0_0","G1_1e9_1e1_0_0","G1_1e9_2e0_0_0","G1_1e9_1e2_0_1","G1_1e9_1e2_5_0")
   )},
   "juliads" = {list(
+    "CSV import Segfault: JuliaLang#55765" = c("G1_1e7_1e2_0_0","G1_1e7_1e1_0_0","G1_1e7_2e0_0_0","G1_1e7_1e2_0_1","G1_1e7_1e2_5_0","G1_1e8_1e2_0_0","G1_1e8_1e1_0_0","G1_1e8_2e0_0_0","G1_1e8_1e2_0_1","G1_1e8_1e2_5_0","G1_1e9_1e2_0_0","G1_1e9_1e1_0_0","G1_1e9_2e0_0_0","G1_1e9_1e2_0_1","G1_1e9_1e2_5_0")
   )},
   "clickhouse" = {list(
   )},
@@ -485,9 +487,11 @@ join.data.exceptions = {list(
     "out of memory" = c("J1_1e9_NA_0_0")                                                  # q1 even when using on-disk, after 47m (480m timeout)
   )},
   "juliadf" = {list(
-    "out of memory" = c("J1_1e9_NA_0_0","J1_1e9_NA_5_0","J1_1e9_NA_0_1")                  # CSV.File
+    # "out of memory" = c("J1_1e9_NA_0_0","J1_1e9_NA_5_0","J1_1e9_NA_0_1")                  # CSV.File
+    "CSV import Segfault: JuliaLang#55765" = c("J1_1e7_NA_0_0", "J1_1e7_NA_5_0", "J1_1e7_NA_0_1", "J1_1e8_NA_0_0", "J1_1e8_NA_5_0", "J1_1e8_NA_0_1", "J1_1e9_NA_0_0")
   )},
   "juliads" = {list(
+    "CSV import Segfault: JuliaLang#55765" = c("J1_1e7_NA_0_0", "J1_1e7_NA_5_0", "J1_1e7_NA_0_1", "J1_1e8_NA_0_0", "J1_1e8_NA_5_0", "J1_1e8_NA_0_1", "J1_1e9_NA_0_0")
   )},
   "clickhouse" = {list(
   )},
diff --git a/_report/index.Rmd b/_report/index.Rmd
@@ -217,6 +217,33 @@ loop_benchplot(dt_join, report_name="join", syntax.dict=join.syntax.dict, except
 
 <!--
 ##### **advanced questions**
+
+![](./join/J1_1e7_NA_0_0_advanced.png)
+-->
+
+#### 5 GB
+
+##### **basic questions**
+
+![](./join/J1_1e8_NA_0_0_basic.png)
+
+
+<!--
+##### **advanced questions**
+
+![](./join/J1_1e8_NA_0_0_advanced.png)
+-->
+
+#### 50 GB {.active}
+
+##### **basic questions**
+
+![](./join/J1_1e9_NA_0_0_basic.png)
+
+<!--
+##### **advanced questions**
+
+![](./join/J1_1e9_NA_0_0_advanced.png)
 -->
 
 ---
diff --git a/_run/partitioned_run.sh b/_run/partitioned_run.sh
@@ -1,4 +1,5 @@
 # set machine type
+<<<<<<< HEAD
 ./_run/run_small_medium.sh
 
-./_run/run_large.sh
+./_run/run_large.sh
diff --git a/_run/run_large_groupby_join.sh b/_run/run_large_groupby_join.sh
@@ -0,0 +1,31 @@
+# download and expand large data
+
+# get groupby large (0.5GB and 5GB datasets)
+aws s3 cp s3://duckdb-blobs/data/db-benchmark-data/groupby_large.duckdb data/groupby_large.duckdb
+# get join small (0.5GB and 5GB datasets)
+aws s3 cp s3://duckdb-blobs/data/db-benchmark-data/join_large.duckdb data/join_large.duckdb
+
+
+# expand groupby-small datasets to csv
+duckdb data/groupby_large.duckdb  -c "copy G1_1e9_1e2_0_0 to 'data/G1_1e9_1e2_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_large.duckdb  -c "copy G1_1e9_1e1_0_0 to 'data/G1_1e9_1e1_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_large.duckdb  -c "copy G1_1e9_2e0_0_0 to 'data/G1_1e9_2e0_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_large.duckdb  -c "copy G1_1e9_1e2_0_1 to 'data/G1_1e9_1e2_0_1.csv' (FORMAT CSV)"
+duckdb data/groupby_large.duckdb  -c "copy G1_1e9_1e2_5_0 to 'data/G1_1e9_1e2_5_0.csv' (FORMAT CSV)"
+
+# expand join-small datasets to csv
+duckdb data/join_large.duckdb  -c "copy J1_1e9_NA_0_0 to 'data/J1_1e9_NA_0_0.csv' (FORMAT CSV)"
+duckdb data/join_large.duckdb  -c "copy J1_1e9_1e9_0_0 to 'data/J1_1e9_1e9_0_0.csv' (FORMAT CSV)"
+duckdb data/join_large.duckdb  -c "copy J1_1e9_1e6_0_0 to 'data/J1_1e9_1e6_0_0.csv' (FORMAT CSV)"
+duckdb data/join_large.duckdb  -c "copy J1_1e9_1e3_0_0 to 'data/J1_1e9_1e3_0_0.csv' (FORMAT CSV)"
+
+
+echo "Running all solutions on large (50GB) datasets"
+./run.sh
+
+
+###
+echo "done..."
+echo "removing data files"
+#rm data/*.csv
+#rm data/*.duckdb
diff --git a/_run/run_small_medium_groupby_join.sh b/_run/run_small_medium_groupby_join.sh
@@ -0,0 +1,59 @@
+# first download and expand small data
+
+# get groupby small (0.5GB and 5GB datasets)
+aws s3 cp s3://duckdb-blobs/data/db-benchmark-data/groupby_small.duckdb data/groupby_small.duckdb
+# get join small (0.5GB and 5GB datasets)
+aws s3 cp s3://duckdb-blobs/data/db-benchmark-data/join_small.duckdb data/join_small.duckdb
+
+
+# expand groupby-small datasets to csv
+duckdb data/groupby_small.duckdb -c "copy G1_1e7_1e2_0_0 to 'data/G1_1e7_1e2_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e7_1e1_0_0 to 'data/G1_1e7_1e1_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e7_2e0_0_0 to 'data/G1_1e7_2e0_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e7_1e2_0_1 to 'data/G1_1e7_1e2_0_1.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e7_1e2_5_0 to 'data/G1_1e7_1e2_5_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e8_1e2_0_0 to 'data/G1_1e8_1e2_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e8_1e1_0_0 to 'data/G1_1e8_1e1_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e8_2e0_0_0 to 'data/G1_1e8_2e0_0_0.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e8_1e2_0_1 to 'data/G1_1e8_1e2_0_1.csv' (FORMAT CSV)"
+duckdb data/groupby_small.duckdb -c "copy G1_1e8_1e2_5_0 to 'data/G1_1e8_1e2_5_0.csv' (FORMAT CSV)"
+
+# expand join-small datasets to csv
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e1_0_0 to 'data/J1_1e7_1e1_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e4_5_0 to 'data/J1_1e7_1e4_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_NA_0_1 to 'data/J1_1e7_NA_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e5_0_0 to 'data/J1_1e8_1e5_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e8_5_0 to 'data/J1_1e8_1e8_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e1_0_1 to 'data/J1_1e7_1e1_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e7_0_0 to 'data/J1_1e7_1e7_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_NA_5_0 to 'data/J1_1e7_NA_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e5_0_1 to 'data/J1_1e8_1e5_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_NA_0_0 to 'data/J1_1e8_NA_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e1_5_0 to 'data/J1_1e7_1e1_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e7_0_1 to 'data/J1_1e7_1e7_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e2_0_0 to 'data/J1_1e8_1e2_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e5_5_0 to 'data/J1_1e8_1e5_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_NA_0_1 to 'data/J1_1e8_NA_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e4_0_0 to 'data/J1_1e7_1e4_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e7_5_0 to 'data/J1_1e7_1e7_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e2_0_1 to 'data/J1_1e8_1e2_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e8_0_0 to 'data/J1_1e8_1e8_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_NA_5_0 to 'data/J1_1e8_NA_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_1e4_0_1 to 'data/J1_1e7_1e4_0_1.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e7_NA_0_0 to 'data/J1_1e7_NA_0_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e2_5_0 to 'data/J1_1e8_1e2_5_0.csv' (FORMAT CSV)"
+duckdb data/join_small.duckdb -c "copy J1_1e8_1e8_0_1 to 'data/J1_1e8_1e8_0_1.csv' (FORMAT CSV)"
+
+
+cp _control/data_small.csv _control/data.csv
+
+
+echo "Running all solutions on small (0.5GB and 5GB) datasets"
+./run.sh
+
+
+###
+echo "done..."
+echo "removing small data files"
+rm data/*.csv
+rm data/*.duckdb
diff --git a/_setup_utils/format_and_mount.sh b/_setup_utils/format_and_mount.sh
@@ -0,0 +1,90 @@
+# script to format mount and copy data.
+
+# remove a leftover instance mount
+rm -rf ~/db-benchmark-metal
+
+# format the mount
+sudo mkfs -t xfs /dev/nvme0n1
+
+mkdir ~/db-benchmark-metal
+# mount the nvme volumn
+sudo mount /dev/nvme0n1 ~/db-benchmark-metal
+# change ownsership of the volume
+sudo chown -R ubuntu ~/db-benchmark-metal/
+
+git clone https://github.com/duckdblabs/db-benchmark.git ~/db-benchmark-metal
+
+# if you have an EBS volume, you can generate the data once, save it on the ebs volume, and transfer it
+# each time.
+
+if [[ $# -gt 0 ]]
+then
+	echo "Creating data"
+	mkdir -p ~/db-benchmark-metal/data/
+	cd ~/db-benchmark-metal/data/
+	echo "Creating 500mb group by datasets"
+	Rscript ../_data/groupby-datagen.R 1e7 1e2 0 0
+	Rscript ../_data/groupby-datagen.R 1e7 1e1 0 0
+	Rscript ../_data/groupby-datagen.R 1e7 2e0 0 0
+	Rscript ../_data/groupby-datagen.R 1e7 1e2 0 1
+	Rscript ../_data/groupby-datagen.R 1e7 1e2 5 0
+	echo "Creating 5gb group by datasets"
+	Rscript ../_data/groupby-datagen.R 1e8 1e2 0 0
+	Rscript ../_data/groupby-datagen.R 1e8 1e1 0 0
+	Rscript ../_data/groupby-datagen.R 1e8 2e0 0 0
+	Rscript ../_data/groupby-datagen.R 1e8 1e2 0 1
+	Rscript ../_data/groupby-datagen.R 1e8 1e2 5 0
+	echo "Creating 50gb group by datasets"
+	Rscript ../_data/groupby-datagen.R 1e9 1e2 0 0
+	Rscript ../_data/groupby-datagen.R 1e9 1e1 0 0
+	Rscript ../_data/groupby-datagen.R 1e9 2e0 0 0
+	Rscript ../_data/groupby-datagen.R 1e9 1e2 0 1
+	Rscript ../_data/groupby-datagen.R 1e9 1e2 5 0
+	echo "Creating 500mb join datasets"
+	Rscript ../_data/join-datagen.R 1e7 0 0
+	Rscript ../_data/join-datagen.R 1e7 5 0
+	Rscript ../_data/join-datagen.R 1e7 0 1
+	echo "Creating 5gb join datasets"
+	Rscript ../_data/join-datagen.R 1e8 0 0
+	Rscript ../_data/join-datagen.R 1e8 5 0
+	Rscript ../_data/join-datagen.R 1e8 0 1
+	echo "Creating 50gb join datasets"
+	Rscript ../_data/join-datagen.R 1e9 0 0
+	cd ..
+elif [[ ! -d "~/db-benchark/data" ]]
+then
+	echo "no arguments passed. Copying data..."
+	echo "ERROR: directory ~/db-benchmark/data does not exist"
+else
+	mkdir -p ~/db-benchmark-metal/data/
+	cd ~/db-benchmark-metal/data/
+	echo "Copying data from ~/db-benchark/data"
+	cp ~/db-benchmark/data/*.csv
+	cd ~/db-benchmark-metal
+fi
+
+
+./_launcher/setup.sh
+
+# setup all the solutions on db-benchmark-metal.
+# creates the necessary python virtual environments and creates the r-libraries
+# needed
+source path.env && python3 _utils/install_all_solutions.py all
+
+
+# setup mount for clickhouse spill
+sudo mkfs -t xfs /dev/nvme1n1
+sudo mkdir /var/lib/clickhouse-nvme-mount/
+sudo mount /dev/nvme1n1 /var/lib/clickhouse-nvme-mount/
+# not sure if below is necessary.
+sudo cp -a /var/lib/clickhouse/. /var/lib/clickhouse-nvme-mount/
+# change ownership of new mount to clickhouse
+sudo chown -R clickhouse:clickhouse /var/lib/clickhouse-nvme-mount/
+sudo chown -R clickhouse:clickhouse /dev/nvme1n1
+
+# add config so clickhouse knows to use the mount to spill data
+sudo cp clickhouse/clickhouse-mount-config.xml /etc/clickhouse-server/config.d/data-paths.xml
+
+echo "------------------------------------------"
+echo "------------------------------------------"
+echo "READY TO RUN BENCHMARK. ./run.sh"
diff --git a/_setup_utils/repro.sh b/_setup_utils/repro.sh
diff --git a/_setup_utils/sleep_and_run.sh b/_setup_utils/sleep_and_run.sh
@@ -0,0 +1,9 @@
+while [ -f run.lock ]
+do
+   sleep 1800
+done
+
+
+rm run.lock
+
+./run.sh
diff --git a/clickhouse/VERSION b/clickhouse/VERSION
@@ -1 +1 @@
-23.10.4.25
+24.8.4.13
diff --git a/collapse/VERSION b/collapse/VERSION
@@ -1 +1 @@
-2.0.3
+2.0.16
diff --git a/dask/VERSION b/dask/VERSION
@@ -1 +1 @@
-2023.10.0
+2024.9.0
diff --git a/datafusion/VERSION b/datafusion/VERSION
@@ -1 +1 @@
-31.0.0
+41.0.0
diff --git a/datatable/VERSION b/datatable/VERSION
@@ -1 +1 @@
-1.14.9
+1.16.99
diff --git a/dplyr/VERSION b/dplyr/VERSION
@@ -1 +1 @@
-1.1.3
+1.1.4
diff --git a/duckdb-latest/VERSION b/duckdb-latest/VERSION
@@ -1 +1 @@
-0.9.1.1
+1.0.99.9000
diff --git a/duckdb/VERSION b/duckdb/VERSION
@@ -1 +1 @@
-1.0.0
+1.1.0
diff --git a/duckdb/setup-duckdb.sh b/duckdb/setup-duckdb.sh
@@ -11,7 +11,7 @@ Rscript -e 'install.packages("DBI", lib="./duckdb/r-duckdb", repos = "http://clo
 cd duckdb
 git clone https://github.com/duckdb/duckdb-r.git
 cd duckdb-r
-git checkout v1.0.0
+git checkout v1.1.0
 cd ..
 ncores=`python3 -c 'import multiprocessing as mp; print(mp.cpu_count())'`
 MAKE="make -j$ncores" R CMD INSTALL -l "./r-duckdb" duckdb-r
diff --git a/juliadf/setup-juliadf.sh b/juliadf/setup-juliadf.sh
@@ -1,11 +1,11 @@
 # install julia
 
-wget https://julialang-s3.julialang.org/bin/linux/x64/1.10/julia-1.10.4-linux-x86_64.tar.gz
-tar -xvf julia-1.10.4-linux-x86_64.tar.gz
-sudo mv julia-1.10.4 /opt
-rm julia-1.10.4-linux-x86_64.tar.gz
+wget https://julialang-s3.julialang.org/bin/linux/x64/1.10/julia-1.10.5-linux-x86_64.tar.gz
+tar -xvf julia-1.10.5-linux-x86_64.tar.gz
+sudo mv julia-1.10.5 /opt
+rm julia-1.10.5-linux-x86_64.tar.gz
 # put to paths
-echo 'export JULIA_HOME=/opt/julia-1.10.4' >> path.env
+echo 'export JULIA_HOME=/opt/julia-1.10.5' >> path.env
 echo 'export PATH=$PATH:$JULIA_HOME/bin' >> path.env
 # note that cron job must have path updated as well
 
diff --git a/juliads/VERSION b/juliads/VERSION
@@ -1 +1 @@
-0.7.18
+0.7.21
diff --git a/juliads/setup-juliads.sh b/juliads/setup-juliads.sh
@@ -1,20 +1,18 @@
-
 # install julia
-wget https://julialang-s3.julialang.org/bin/linux/x64/1.10/julia-1.10.4-linux-x86_64.tar.gz
-tar -xvf julia-1.10.4-linux-x86_64.tar.gz
-sudo mv julia-1.10.4 /opt
-rm julia-1.10.4-linux-x86_64.tar.gz
 
+wget https://julialang-s3.julialang.org/bin/linux/x64/1.10/julia-1.10.5-linux-x86_64.tar.gz
+tar -xvf julia-1.10.5-linux-x86_64.tar.gz
+sudo mv julia-1.10.5 /opt
+rm julia-1.10.5-linux-x86_64.tar.gz
 # put to paths
-echo 'export JULIA_HOME=/opt/julia-1.10.4' >> path.env
+echo 'export JULIA_HOME=/opt/julia-1.10.5' >> path.env
 echo 'export PATH=$PATH:$JULIA_HOME/bin' >> path.env
-echo "export JULIA_NUM_THREADS=40" >> path.env
 # note that cron job must have path updated as well
 
 source path.env
 
 # install julia InMemoryDatasets and csv packages
-julia -q -e 'using Pkg; Pkg.add(["InMemoryDatasets","DLMReader", "PooledArrays", "Arrow"])'
+julia -q -e 'using Pkg; Pkg.add(["InMemoryDatasets","DLMReader", "PooledArrays", "Arrow", "CSV"])'
 julia -q -e 'include("$(pwd())/_helpers/helpersds.jl"); pkgmeta = getpkgmeta("InMemoryDatasets"); println(string(pkgmeta["version"])); pkgmeta = getpkgmeta("DLMReader"); println(string(pkgmeta["version"]))'
 
-./juliadf/ver-juliads.sh
+./juliadf/ver-juliadf.sh
diff --git a/logs.csv b/logs.csv
@@ -1790,4 +1790,4 @@ ip-172-31-31-147,1720089751,duckdb,1.0.0,1f98600c2c,join,J1_1e8_NA_5_0,172009121
 ip-172-31-31-147,1720089751,duckdb,1.0.0,1f98600c2c,join,J1_1e8_NA_0_1,1720091226.51143,start,,,xlarge
 ip-172-31-31-147,1720089751,duckdb,1.0.0,1f98600c2c,join,J1_1e8_NA_0_1,1720091262.47306,finish,0,0,xlarge
 ip-172-31-31-147,1720529276,duckdb,1.0.0,1f98600c2c,join,J1_1e9_NA_0_0,1720529277.33854,start,,,xlarge
-ip-172-31-31-147,1720529276,duckdb,1.0.0,1f98600c2c,join,J1_1e9_NA_0_0,1720530147.30009,finish,0,0,xlarge
+ip-172-31-31-147,1720529276,duckdb,1.0.0,1f98600c2c,join,J1_1e9_NA_0_0,1720530147.30009,finish,0,0,xlarge
diff --git a/pandas/VERSION b/pandas/VERSION
@@ -1 +1 @@
-2.1.1
+2.2.2
diff --git a/polars/VERSION b/polars/VERSION
@@ -1 +1 @@
-1.1.0
+1.8.2
diff --git a/polars/join-polars.py b/polars/join-polars.py
diff --git a/pydatatable/VERSION b/pydatatable/VERSION
diff --git a/spark/VERSION b/spark/VERSION
diff --git a/test.txt b/test.txt
diff --git a/time.csv b/time.csv