Railsでバッチファイルを書く時に気にしていること

Ruby on Rails のバッチファイルに関して、書く際気にしていること・よくレビューで指摘されることをまとめます。

ActiveRecord::Base.transaction を使う

バッチ処理では DB の値を操作することが多く、1 つのバッチ処理が途中で失敗して部分的にレコードが書き換わる状態は避ける必要があります。

ActiveRecord::Base.transaction を使うと処理途中で例外が発生した場合、ブロック内の処理をロールバックしてくれます。気をつけるべきポイントは、ロールバックは例外が発生した時しか行われないということです。なので保存や更新に失敗した場合には例外になってほしいので、ブロック内では、update!save!など ! がつくメソッドを使用します。

ActiveRecord::Base.transaction do
  product = Product.first
  product.update!(price: 10000)
end

参考: Rails の Transaction の使い方 - Qiita

find_each を使うもしくは order で並び順を指定する

既存のテーブルからテーブル名を変更したいとします。この場合、既存テーブルのレコードを新規のテーブルに挿入するバッチ処理を書く時、最初は以下のように書いていました。

OldModel.all.each do |old|
  NewModel.create!(name: old.name)
end

問題になるのはallで発行される SQL が並び順を指定していない点です。to_sql で確認してみると、以下のようになります。

[1] pry(main)> User.all.to_sql
"SELECT \"users\".* FROM \"users\""

なので each ではなく、find_each を使うか order(:id) で順番を明示的に指定します。コンソールで find_each を実行すると ID でソートしていることを確認できます。

# find_each はIDでソートしている
[1] pry(main)> User.find_each do end
  User Load (7.2ms)  SELECT "users".* FROM "users" ORDER BY "users"."id" ASC LIMIT $1  [["LIMIT", 1000]]
=> nil

参考: 【Rails】開発環境とテストコード上(または本番環境)でデータの並び順が異なる場合の原因と対処方法 - Qiita

本番のデータをダウンロードしてバッチ処理を試す

開発環境やステージングで成功したバッチ処理でも、本番環境では失敗する可能性はあります。本番 DB に保存されている複雑なデータを考慮できていなかったなどが原因です。

これを避けるため本番データをローカルにダウンロードして、ローカルでバッチ処理を走らせます。以下は Heroku のバックアップデータをダウンロードして、pg_restoreで開発環境の DB に入れる手順です。

$ rails db:drop && rails db:create
# mydbにDB名、latest.dumpにDLしたデータのパス
$ pg_restore --verbose --clean --no-acl --no-owner -h localhost -d mydb latest.dump
$ # バッチ処理
$ rm latest.dump

参考: Importing and Exporting Heroku Postgres Databases | Heroku Dev Center