2026年02月日記

日記
Published

February 19, 2026

2026年02月16日(月)

だいぶ春めく昨今。気がつけば日記をサボって1ヶ月余り。

12月から1月にかけて、忙殺されていた。論文準備に講義やらなんやら。近頃とみに研究は楽しい。他はなんともはや。

今日やったこと

  • 工業団地データ入力
  • いろいろ評価
  • 新年度支度

工業団地求人票

Chatty殿に頼んで、画像から求人票情報を抜こうと試みた。とりあえず某工業団地分350枚。たしかに上手に抽出できた箇所がある一方、抜け落ちていたり間違っていたりする箇所が多い。以前試したGoogle翻訳APIやApple写真翻訳よりも、至らないような点が目立つ。とはいえ、無料だし処理中に他用をこなせることはありがたい。

いろいろ考えてみたところ、書いてある主要な項目を一覧にして、横目で眺めながら手作業で打ち込んだほうが早いという結論を得た。とはいえ、企業毎に少しずつ違う項目があり、一覧をつくるだけでも結構な作業ではある。しかもタイ語。こういうときにもChattyがいい仕事をしてくれる。タイ語綴は修正してくれるし、意味を問えばちょっとした解説もつけてくれる。

実は、電産型賃金体系なんじゃないかという気がする今日このごろ。

新年度支度

研究室に新しい学生4名が加わる。放っておいても仕方がないから、さしあたり作業場所を提供するべく、研究室を用意した。4名には狭いかもしれないけれど、狭いくらいが快適かもしれない。あとは換気にだけ注意してほしい。

さて、なにをしようか、もう少し煮詰めないことには春が来ない。1月後からたびに出かけるから、その前には片付けたいところ。読書課題第一弾は出した。

  • 第2弾 ちょっと面倒めな新書(『日本の思想』などなど)
  • 第3弾 洋物HRM教科書
  • 第4段 洋雑誌論文

フィールドをこなす方法に解析に、いろいろやらないといけないねぇ。諸君、寝てる暇あるのかな。

畑情報

冬はすることがあまりない。とはいえ、もう2月も半分過ぎた。来月には長ねぎを植えるから、植える場所から耕すことにした。スコップで27(3)を掘ると、まだまだ粘土。籾殻と牛糞を施して、できるだけ耕すことに。あとは植える直前に耕運機で耕そう。そういえば、耕運機をオーバーホールしないといけなかった。

これが終わったら、寒起こししたところを順次耕す。終わった頃には3月中旬。出張から帰ってきてから3月末に麦をすき込んで夏野菜に備えましょう。

2026年02月17日(火)

冬季オリンピックフィギュアスケートペアは圧巻。生きているうちになんて素晴らしいものを見ることができた。永久保存。

今日やったこと

  • 工業団地データ入力(つづき)
  • ラムヤイ園面積推定

工業団地データ入力

きょうは9件入力できた。昨日は1件だけだった。

入力が速くなった理由は、タイ語にて求人票に書かれたことを解読できる程度に用語集が確立してきたこと、わからない語彙を検索するために必要なタイ語入力が速くなったことであろう。明日は版日で20件はこなしたい。そして、今週中に400件すべて入力してしまいたい。こういうものは、一気呵成にやることに意義がある。

それにつけても、さまざまな手当や福利厚生があるものだと感心する。書かれていないことも当然あるでしょうけれど。基本給は400THB/日に張り付いているけれど、いろいろあることをみると、いろいろ考えているのでしょう。でも、基本給を増やさないで手当でなんとかという発想はなんとも日本企業。

ラムヤイ園面積推定

ラムヤイ園面積推定をすることに。コーヒーはなかなか難しい。ラムヤイは栽培規模がコーヒーよりも大きく、労働力人口季節変動に与える影響も大きい。端的には、

\[\begin{equation} \begin{aligned} Y_{t} &\sim N(x_{t}, \sigma_{t}^{2}) \\ \sigma_{t} &= \sigma_{0} + \beta\, \text{lamyai\_production}_{t} + \varepsilon \end{aligned} \end{equation}\]

みたいなものを想定する。\(\sigma\)を推定しようとすると発散しそうで怖いけれど、アイディアとしてはおもしろいとおもう。労働力人口\(Y_{t}\)は、農事暦にしたがって変動することが知られるが、どのような作物とどう関連しながら変動するかについては、あんまり研究がないようにおもわれる。

きょうは統計資料を確認しつつ、調査手順を検討した。前者をインターネット経由にて入手することは、2020年以降ならできるがそれ以前は絶望的。必要な部分だけ、アジ研図書館に頼んで複写させてもらおう。

そしてやっぱり早めにやっつけないといけない労働力人口というか人的資源量推定。

ラムヤイ園面積推定に使う教師データ収集調査手順は、以下に示す通り。

  1. 紹介してもらったラムヤイ園周囲を、ペリメータトランセクト法にて回る:ライントランセクトが理想だが、開花時期にはラムヤイ園内部に立ち入らないほうがいいようにおもわれる。GPSは例のごとく1秒測位。
  2. 1.から40m程度引っ込んだ、ちいさな外周をつくる。40mひっこませるのは、道路による影響を避けるため。
  3. 2.から90m四方のポリゴンをいくつか抽出する。同時に、100m程度離れたポイントを抽出する:ポイントならば500点程度必要。ライントランセクト長なら、8km弱くらい。
  4. GEEにくわせて、学習開始。
  5. 味わう。

2026年02月18日(水)

冬季オリンピックフィギュアスケート女子(ショートプログラム)は圧巻。生きているうちになんて素晴らしいものを見ることができた。永久保存。

今日やったこと

  • 工業団地データ入力(つづき)
  • ラムヤイ園面積推定(つづき)

データ入力(つづき)

飽きる. 2時間か3時間かけて、いまのところ5件か10件がいいところ。タイ語による求人票内容を読み切れていない。求人票項目は統一されないうえ、独自内容が付加される場合が多い。おもしろいけれど、作業はなかなか進まない。うーむ。千里の道も一歩から。

ラムヤイ園面積推定

LFSを使う必要があるから、NSOから最新データをダウンロードできるか、ひさびさに確かめた。なんと、ファイル名から都県を類推できなくなっている。以前はできたし、いまでもできる都県はある。が、できない県もまた多い。

ごく一部(県・性・四半期別労働力人口Total labor forceとCurrent labor forceと失業者数Unemployedと非労働力人口Not in labor force)だけが必要だけれど、仕方ない。作り直すとすれば、考えられる方針は以下3案。

  1. データを眺めて手で打ち込み。
  2. データをコピペ・整形。
  3. ファイルからRなどでコードを書いて読み取る。

一長一短あるけれど、案3がよさそう。かなり時間はかかる。該当するファイルを集めて、なければダウンロードして、フォルダに入れて、台帳をつくらないといけないから。これが本職だから、やるしかないでしょう。台帳には、以下を含める。

  • file_id: 任意の一意ID。123で十分。
  • source_path: 原本ファイルパス。
  • working_path: 作業フォルダパス。
  • variable:
    • Population 15 years and over ประชากรอายุ 15 ปี ขึ้นไป
    • total labor force กำลังแรงงานรวม
    • employed กำลังแรงงามผู้มีงานทำ
    • unemployed กำลังแรงงามผู้ว่างงาน
    • seasonally inactive labor force กำลังแรงงานรวที่รอฤดูกาล
    • person not in labor force ที่รอฤดูกาลที่รอฤดูกาล
  • unit: persons
  • format_type: フォーマット。だいたいの型。縦型とか横型とか。

古いものは1994(2537)年からあり、76(途中から77)県ある。いやはやなんと申し上げてよろしいやら。ファイルを整理整頓するだけでも、気が遠くなる。でもやらないと。ファイル数は2000を超える。となると、やはり手入力やコピペよりも、自動化したほうがマシなことは間違いない。

農業統計について、アジア経済研究所図書館に、ILLによるAgricultural statistics of Thailand貸借について照会した。冊子体貸借はダメらしく、複写(@30円)だけになるみたい。ラムヤイとコーヒーを依頼しようか。両者は北部名物で、チェンマイ県とランプーン県についてデータが収録される。コーヒーは、将来に備えたおまけ。カフェ巡り研究に役立つかもしれないし。

どれもこれもいやはや、手がかかるなぁ。やれば結果は出るけれどやらないと先にすすまない農筋努力と根性研究。とはいえ、いまどきこういうのが案外いいのかもしれない。