言語マニア系ポストクロッサー

ポストクロッシング初心者

ポストクロッシングに関する分析(6)~アメリカ宛ポストカードの未着状況とその要因

 

1. はじめに

 ポストクロッシングというポストカードを送りあうオンラインサービスがある。コンピューターによってランダムで抽出された会員にポストカードを送ると、ランダムで引いた世界のどこかの別の会員からポストカードが送られてくるシステムである。

 本記事では、日本からアメリカへ発送するポストカードの到着と未着の状況を集計し、分析によってポストカードが未着となる要因を探ることにする。

 

 

2. アメリカのポストカードについて

2.1 アメリカから発送されたポストカードのバーコード

 アメリカから送られてきたポストカードは、下部にバーコードが印字されてくる。ポストカードに予めそのための空白が設けられている。

図1 アメリカから来たポストカード

 

図2 ポストカードのバーコード用に確保されている空白

 

ほとんどのバーコードは、ハガキに直接印字されている。しかし、時には印字されたシールが貼りつけられていることもある。このシールはきれいに剥がれるため、ハガキに損傷はない。

図3 バーコード印字のシールが貼られたポストカード

 

マスキングテープの上に印字されたバーコードもある。

図4 マスキングテープの上から印字されたバーコード

 

 

2.2 アメリカへ発送したポストカード

 今回は私がアメリカに発送したポストカードのデータを使う。

 最近は、下部にバーコード用の空白を残している。字は上手くはないが、配達を困難にするほどではない。

図5 バーコード用の空白があるポストカードの例

最初の頃は、図6および図7のようにバーコードの位置にシールを貼ってしまっていた。

図6 バーコードの位置にシールを貼ったポストカードの例

 

図7 バーコードの位置にシールを貼ったポストカードの例

 

シール以外にも、マスキングテープも貼っていた。図8は、マスキングテープとシールの両方を貼っている。

図8 マスキングテープとシールを貼ったポストカードの例

 

 これらのように、バーコードの位置に空白があるもの、シールを貼ったもの、マスキングテープを貼ったもの、その両方を貼ったもの、文字(メッセージ)を書き込んだもの、様々なパターンのポストカードを送っている。

 

 

3. 基礎集計

3.1 アメリカ宛ポストカード到着数と未着数

 本記事では、2023年4月から2025年3月までに私がアメリカ宛に送ったポストカードのデータを使う。今回使用したデータについて、オフィシャルおよびフォーラム経由でアメリカへ発送したポストカードの到着数と未着数を集計した。その結果を図9に示す。

図9 アメリカに発送した経由別ポストカード到着数と未着数

 

 オフィシャル経由のポストカードの未着は1通である。このポストカードは下部にマスキングテープを貼っていた。

 フォーラム経由で送ったポストカードは、15通中8通が未着であった。半数近くである。但し、オフィシャルとは違い、フォーラムでは到着の連絡は必須ではないため、未着の中に実際には到着しているハガキが含まれている可能性が高い。オフィシャルの到着率が高いことを考慮すると、フォーラムの未着の多くは実際には到着している可能性も考えられなくはない。

 

3.2 バーコードスペース有無別ポストカード未着到着数と割合

 バーコードのためのスペース有無別でポストカード到着数と未着数を集計した結果を図10に示す。また、スペース有無別の到着と未着の割合を図11に示す。

 

図10 バーコードのスペースの有無別ポストカード到着数と未着数

 

図11 バーコードのスペースの有無別ポストカード到着率と未着率

 

 バーコードが印字されるだろう部分を空けたポストカードは、到着率92.3%でほとんどのポストカードが到着している。一方、空けなかったポストカードは、到着4通に対して未着が6通だった。60%が未着である。3.1の図9より、フォーラム経由の未着は8通である。受け取りの連絡がないのではなく、実際に相手に届いていない疑惑が浮かび上がってくる。

 

3.3 バーコードスペース有無別未着到着数~オフィシャルとフォーラム比較

 オフィシャルとフォーラムにおけるバーコードスペース有無別でポストカード到着数と未着数を集計した。その結果を図12に示す。

 

図12 バーコードスペースの有無別到着未着数(オフィシャルとフォーラムで比較)

 

 フォーラム経由のポストカードは、バーコードスペースがあったポストカードの未着が3通、スペースを空けなかったポストカードの未着が5通だった。一方、オフィシャル経由では、スペースを空けたポストカードは全て届いている。

 オフィシャルの結果を元に、バーコードスペースを設けたポストカードが極めて高確率で届くと仮定すれば、フォーラムの未着8通のうち3通は、受け取りの連絡なしと推測できなくはないだろう。

 

3.4 宛名表記別ポストカード未着数と到着数

 オフィシャルとフォーラム毎に、手書きの宛名と印刷した宛名で比較した。それらのポストカード到着数と未着数を集計した結果を図13に示す。

 

図13 宛名表記別到着未着数(オフィシャルとフォーラムで比較)

 

 印刷した宛名で送ったポストカードの未着はフォーラム経由1通だった。手書きの宛名で送ったポストカードは、フォーラムでは到着12通に対し、未着は7通であった。オフィシャル経由の未着1通は手書き宛名だった。印刷した宛名は高確率で到着している。

 

 

4. ロジスティック回帰分析

4.1 目的

 アメリカ宛に発送したポストカードは、バーコード部分に空白がないポストカードや手書きの宛名のポストカードの未着が多かった。空白がないポストカードには、マスキングテープ、シール、書き込みのいずれかがあったもの、またはそれらが複数あったものがある。どのような条件下だと未着が発生するのか。未着が起こりやすい要因を推定することを目的とする。

 

4.2 方法

 アメリカ宛に発送した52通のデータを使用し、未着が起こりやすい要因を特定するために、ロジスティック回帰分析を用いた。ロジスティック回帰分析は、「到着する」か「到着しない(未着)」といった二値変数の結果の要因を予測する分析手法である。要因となる変数を説明変数、結果の変数を目的変数と言う。目的変数を「未着1」、「到着0」とし、説明変数をマスキングテープ、シール、(バーコード部分への)書き込み、宛名手書きとした。宛名を印刷したポストカードの未着はなかったため、説明変数から宛名印刷を除外した。

 説明変数間に強い相関があると、分析を実行する上で問題が生じる。そのため、強い相関がある変数を除いて分析を実行しなければならない。各説明変数間の相関だけでなく、ひとつの説明変数と残りの全部の変数の間の相関も調べることができる分散拡大要因と呼ばれる指標で確認した。

 得られた分析結果から、未着が起こる要因となる説明変数を特定した。

 

4.3 結果

4.3.1 基礎集計

 用いたデータの内訳を表1に示す。

表1 アメリカに発送したポストカードの発送数とその内訳

 

 発送数52通のうち、未着が9通で手書きの宛名が38通である。バーコード部分に空白を設けなかった10通のうち、マスキングテープが6通、シールが8通、書き込みが8通である。

 

4.3.2 多重共線性の確認

 説明変数における多重共線性の指標であるVIF(分散拡大要因)の計算結果を表2に示す。

(※スマホを縦にすると表が崩れます)

 

表2 VIF(分散拡大要因)の計算結果

----------------------------------------------------------------
マスキングテープ シール 書き込み 宛名手書き
----------------------------------------------------------------    1.831955 2.686244 1.795339 1.197285
----------------------------------------------------------------

 

 表2の通り、全ての説明変数が10以下で、強い相関のある変数はなかった。したがって、分析を実行する際に削除する必要がある説明変数はなく、最初に設定した全ての説明変数を用いて実行した。

 

4.3.3 ロジスティック回帰分析実行結果

 ロジスティック回帰分析の実行結果を表3に示す。

(※スマホを縦にすると表が崩れます)

 

表3 ロジスティック回帰分析実行結果

-------------------------------------------------------
Coefficients 係数: Estimate Std. Error z value Pr(>|z|)
          推定値   標準誤差  Z値    P値
------------------------------------------------------- (Intercept)定数項 -2.5649 1.0377 -2.472 0.0134 * マスキングテープ  3.3829 1.7588 1.923 0.0544 . シール -0.1037 1.7356 -0.060 0.9523 書き込み 2.0357 1.4827 1.373 0.1697 宛名手書き -0.1565 1.2896 -0.121 0.9034
-------------------------------------------------------

 

 P値は、目的変数に影響を与えているかを判断するための指標である。一般的に、P値が0.05より小さい場合は統計的に差があると言える。マスキングテープのP値の小数第3位を四捨五入すれば0.05となり、マスキングテープが統計的に差がある変数となった。

 

 各説明変数とオッズ比と対応する信頼区間の計算結果を表4に示す。また、表4のグラフを図14に示す。

 

表4 オッズ比推定値

変数名 調整オッズ比 信頼区間下限 信頼区間上限
(Intercept) 0.077 0.07692308 0.004234138  
マスキングテープ 29.455 29.45465851 1.719190402  
シール 0.901 0.90147919 0.015399472  
書き込み 7.658 7.65761740 0.451443637  
宛名手書き 0.855 0.85514029 0.070264192  

 

 

図14 説明変数のオッズ比と対応する信頼区間

 

 オッズ比から、説明変数がどの程度目的変数に影響を与えるかがわかる。オッズとは、ある事象が起こる確率と起こらない確率の比である。また、オッズ比は、未着が発生するオッズが、特定の条件を持つ群と持たない群でどの程度異なるかをあらわす指標である。さらに、95%信頼区間とは、集団から無作為にひとつ選んだ時、95%の確率でその値になる区間のことである。95%信頼区間下限と95%信頼区間上限で信頼区間が1を跨がない場合に、統計的に有意な差があると言える。

 表4の計算結果では、1より大きいオッズ比はマスキングテープ、1より小さいオッズ比はシールと宛名手書きであった。

 図14では、信頼区間が1を跨がない変数が視覚的にわかりやすいように、オッズ比1の位置に赤線を入れた。赤線を跨いでいない変数が有意な差がある変数となる。

 

4.4 考察

 ロジスティック回帰分析を用いて、マスキングテープ、シール、バーコード部分への書き込み、手書きの宛名とポストカード未着の間の関係を分析した。p値によって有意な差が得られた説明変数は、マスキングテープであった。また、信頼区間によって有意な差が得られた説明変数は、マスキングテープ、シールおよび宛名手書きであった。したがって、p値、信頼区間、共に有意な差が得られた説明変数は、マスキングテープとなる。

 オッズ比が1より大きい場合は事象に対して促進方向に作用し事象が起こりやすく、1より小さい場合は抑制方向に作用し事象が起こりにくくなる。つまり、オッズ比が1より大きかったマスキングテープは未着が起こりやすい変数となる。

 これらのことから、バーコード印字部分にマスキングテープを貼ると、未着が起こりやすい傾向があることがわかった。

 

4.5 最後に

 アメリカ宛のポストカードでは、バーコードが印字される部分にマスキングテープを貼ると未着が起こりやすい傾向があることがわかった。マスキングテープが貼られていても到着することはある。しかし、マスキングテープを貼らない方が到着率が上がると言えよう。

 

 わざわざ分析などしなくても、経験上マスキングテープを貼っていると期限切れになることが多いとわかっているポストクロッサーはいるだろうと思う。かくゆう私も、今思い返せば、マスキングテープを購入して使い始めてからアメリカ宛の未着が増えてきた。

 

 次回はインドについて集計した結果を記事にする。

 

 

<過去のポストクロッシングに関する集計や分析の記事>

ポストクロッシングの国別登録数および活動状況(1) ~基礎集計 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(2) ~平均発送数と登録者割合の関係 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(3)~インターネット環境および国民総生産との関係 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(4) ~ポスクロにおける日本の位置づけ - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(5)~ポストカード到着率 - 言語マニア系ポストクロッサー

 

ポストクロッシングにおける国別活動状況(5)~ポストカード到着率

 この記事では、国別にポストカードの到着と未着について集計していく。

 

以前の集計結果はこちら

postkarte.hatenablog.com

postkarte.hatenablog.com

postkarte.hatenablog.com

postkarte.hatenablog.com

 

0. はじめに

 ポストクロッシングでは、時々ポストカードが相手に届かないことがある。オフィシャルでは、60日を超えるとexpired(期限切れ)となる。ポストクロッシングのサイトでは、日本から送ったハガキが届いたかどうかは把握できるが、自分宛に送られたハガキが全て届いているかはわからない。届いていないハガキについて知る由もない。

 ポストクロッシングサイトには、フォーラムという場所がある。ここでは事前に相手と直接連絡を取り合ってからハガキのやり取りをする。つまり、フォーラムを通じたハガキについては、日本に届かなかったハガキの存在がわかるのだ。

 

1. 基礎集計

1.1 フォーラムにおける国別送受信数

 私が2023年4月から2025年3月末までにフォーラムを通じて送受信したポストカード403通のデータを使う。このデータの未着ハガキは全て2ヶ月以上経過している。今回用いたデータの集計結果を図1に示す。

 

図1 フォーラムにおけるポストカード送受信数

 

 オフィシャルと同様に、ドイツとアメリカが多い。オフィシャルに比べ中国のサンプル数が多いのは、フォーラムでは中国の参加が多いからである。フィンランドの送信が多いのは、個人的事情である。フィンランド語を書きたくなる発作が定期的に起こるため、タグ付けすることが多い。インドが多いのも個人的事情である。ラテン文字キリル文字以外の文字の国を常に狙っているからだ。さらに、レア国に送る機会を常に狙っているため、送信の方が受信よりも広範囲の国を網羅している。

 

 

1.2 フォーラムにおける送受信別到着未着の割合

 次に、発送および受取ごとの未着と到着の割合の結果を図2に示す。

 

図2 フォーラムにおけるポストカード送受信別未着と到着の割合

 

 海外から日本への発送は92.3%到着しており、未着は7.7%しかない。一方、日本から海外への発送は、29.3%が未着となっており、1/3近くが到着していない。しかし、オフィシャルと違い、フォーラムでは受け取ったハガキの登録がないため、受け取り人の送信者への連絡は義務ではない。したがって、日本から海外へのデータは、相手からの受け取りの連絡がないものが含まれている。

 

 

1.3 フォーラムにおける日本から海外への発送

 日本から海外に送ったポストカードについて、到着したポストカードと未着のポストカードを集計した。結果を図3に示す。

図3 日本から海外へ発送したポストカードの国別到着数と未着数

 

 日本から海外に発送したポストカードの未着は、特定の国に集中することなく全体的に散らばっている。私はレア国、インド、中国、中東への発送には自分の住所も記載しているが、一度も戻ってきたことはない。海を渡るまでは郵便事故がないことは確実である。そして、未着が特定の国に集中していないことを考えると、到着の連絡がないものが多く占めているのではないかと疑いが出てくる。但し、インド宛未着8通のうち4通については、相手と直接連絡を取っており、紛失が確認されている。

 

 

1.4 フォーラムにおける海外から日本への発送

 次に、海外から日本に送られたポストカードの到着と未着の通数を国別に集計した。その結果を図4に示す。

図4 海外から日本へ発送されたポストカードの国別到着数と未着数

 

 海外から日本に発送された(はずの)未着のポストカードは少ない。その少ない未着が郵便事故なのか、それとも送り主がそもそも送っていないのかはわからない。しかし、ひとつ確実に言えるのは、日本に到着したハガキは、ほぼ100%私の自宅まで届くはずである。実際、オフィシャルでは、この文字でよく解読して届けてくれたものだと感心せずにはいられないハガキが稀にある。その点、フォーラムを通じて送ってくれる人は字が読みやすい人が多い。さらに、私の住所は、市町村名の一部や番地が抜け落ちたとしても届くような表記になっている。したがって、これらの未着は、海を渡る前に相手国で紛失、または相手の送り忘れ(orサボり)のどちらかと考えている。サンプル数が少ない国については、紛失と送り忘れのどちらかは不明である。

 

 

2. 日本から海外への発送におけるオフィシャルとフォーラムの比較

 これまで、フォーラムにおけるポストカードの集計結果を述べてきた。2章では、オフィシャルのデータとフォーラムのデータを比較する。オフィシャルでは、海外から日本へのハガキの未着は、受取り側からはわからない。したがって、日本から海外へのハガキについてのみ比較する。

 

2.1 オフィシャルにおける国別送受信数

 ポストクロッシングのオフィシャルで海外へ発送した200通分のデータを用いる。オフィシャルなので、国は全てランダムに選出されている。

 オフィシャルにおける国別ポストカード発送数の集計結果を図5に示す。

 

図5 オフィシャルにおける国別ポストカード発送数
 

 海外へ200通送ったうち、未着はたった3通しかなく非常に少ない。アメリカ、中国、ベラルーシにそれぞれ1通ずつである。サンプル数が少ないレア国には、全て届いている。

 オフィシャルでの未着の3通は原因が推測できる。まず、アメリカ宛は紛失の可能性が高い。なぜなら、同じ相手に2通目を送り、その2通目は届いており、相手から連絡があったからだ。中国宛は住所不明による未着である。なぜなら、住所を引いた直後に引っ越されたと公式から連絡があったからである。ベラルーシ宛は、住所を引いた直後からユーザーが非アクティブになり、全くログインしなくなった。つまり、郵便事故はアメリカ1通だけであり、残り2通は不運だっただけで郵便事故とは言えない。純粋な郵便事故は、200通中1通と言えよう。

 

 

2.2 日本から海外へ発送におけるオフィシャルとフォーラムの比較

 オフィシャルとフォーラムにおける日本から海外への発送数と割合を集計した。結果を図6に示す。

 

図6 オフィシャルとフォーラムにおける日本から海外へ発送したポストカードの到着と未着の割合

 

 オフィシャル200通のうち未着が3通で1.5%に対し、フォーラムでは208通のうち未着が61通で29.3%と、大きな差がある。2.1で述べた通り、オフィシャルの郵便事故は200通中1通である。フォーラムの未着のうち郵便事故は少数で、到着したが受取人からの連絡がなかったものがほとんどの可能性がある。

 

 

2.3 オフィシャルとフォーラムにおける日本から海外への発送

 オフィシャルとフォーラムにおける日本から海外への発送数を国別に集計した。その結果を図7に示す。

 

図7 オフィシャルとフォーラムにおける日本から海外への国別発送数

 

 オフィシャルと比べ、フォーラムでは中国の参加が多いことがわかる。オフィシャル12通に対し、フォーラムでは23通となっており、フォーラムはオフィシャルの倍近くある。

 逆に、ベラルーシルーマニア、オランダはフォーラムの参加が少ない。ベラルーシは、オフィシャル12通に対し、フォーラム0通である。オランダはフィシャル12通に対しフォーラム4通、ルーマニアはオフィシャル5通に対し1通となっている。特にルーマニアとオランダは意図的に狙っているにもかかわらず、この結果である。

 1.3および2.1で述べたが、オフィシャルのアメリカ宛1通とフォーラムのインド宛4通は、郵便事故が確認されている。オフィシャルからのインド宛は、サンプル数4と少ない。たまたま郵便事故に遭わなかった可能性も考えられなくはない。

 

 

3. 最後に

 フォーラムによる日本から海外への発送は、1/3近くが未着であった。オフィシャルと比較することで、フォーラムでは、3~4人にひとりが受取りの報告をしない傾向があることが示唆された。それは特定の国に偏りはなく、どの国にも一定数いると思われる。

 

 

 

 オフィシャルによる日本からの発送は、2.1で述べた通り、200通中アメリカ宛1通が郵便事故と思われる(未着率0.5%)。アメリカ宛に限れば、28通中1通で未着率3.6%となる。一方、フォーラムから発送したアメリカ宛は、23通中8通が未着だった(未着率34.8%)。郵便事故か、それとも、受け取ったが連絡なしのどちらがどのくらいか、次の記事で集計と分析をする予定だ。

 

 インドは、1.3でも述べた通り、フォーラムで日本から発送した未着8通のうち、半数にあたる4通が郵便事故であることが確定している。インドについては、今後の記事で掘り下げていく。

 

 

<次の記事>

ポストクロッシングに関する分析(6)~アメリカ宛ポストカードの未着状況とその要因 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(4) ~ポスクロにおける日本の位置づけ

 ポストクロッシングの2025年3月21日のデータ[1]から、ポストクロッシングが比較的活発な国をグループ分けしてみることにする。

以前の記事「ポストクロッシングにおける国別活動状況(3)」の続きである。

 

以前の集計結果はこちら

postkarte.hatenablog.com

postkarte.hatenablog.com

postkarte.hatenablog.com

 

 

目的

 ポストクロッシングにおける各国の特徴を明らかにし、ポストクロッシングでは日本がどのような位置づけか探ることを目的とする。

 

方法

 登録者1000人以上、人口一万人以上、発送一万通以上の国を対象とする。変数は、登録者数、ポストカード発送数、その国における人口当たりの登録者の割合、平均ポストカード発送数を用いる。

 パーセンテージ類似度を使用し、ウォード法により階層型クラスター分析を実行する。その実行結果からデンドログラムを作成し、国ごとにグループ分けをする。パーセンテージ類似度の計算には、クラスター分析でよく使われ、かつ変数に相関があることからユークリッド平方距離を用いる。また、クラスター分析でよく使われるウォード法を用いることとする。

 さらに判別分析を実行し、クラスター分析によってグループ分けされた各グループの特徴を探し出す。

 

結果

クラスター分析による分類

 国の分類を行うために、パーセンテージ類似度を使用し、ウォード法により階層型クラスター分析を実行した。その結果から作成したデンドログラムを6つのグループに分けて図1に示す。

図1 パーセンテージ類似度・ウォード法によるクラスター分析のデンドログラム

 

各グループは以下のように分類された。

Group1

Australia, Austria, Belgium, Hong Kong, Lithuania, Malaysia, Portugal, Spain, Switzerland, Bulgaria, Estonia, Hungary, Ireland, Latvia, New Zealand, Norway, Serbia, Singapore, Slovakia, Slovenia, Sweden, Turkiye

Group2   Belarus, Taiwan 

Group3   Czech Republic, Japan,Canada, Poland, France,Ukraine, United Kingdom

Group4   Finland, Netherlands

Group5   Germany

Group6   Russia, United States of America

 

 

判別分析の結果

 ここでは、クラスター分析によってグループ分けされた各グループが、どの変数が寄与して、どのような条件で得られたのかを正準判別分析により探し出すことになる。

 正準判別分析の結果を表1から表4および図2に示す。

スマホを縦にすると表がズレます。

 


表1 グループの事前確率
----------------------------------------------------------------- 1 2 3 4 5 6
-----------------------------------------------------------------
0.61111111 0.05555556 0.19444444 0.05555556 0.02777778 0.05555556 
-----------------------------------------------------------------


表2 各グループにおける説明変数の平均値
-----------------------------------------------------------------------
 登録者数     総発送数     登録者比率  平均発送数 千人当たりの登録者数 
-----------------------------------------------------------------------
1  4048.00       481950.1      0.005030671    134.61060    5.572331
2 71516.50      3062534.5      0.088877469     61.20488   40.875545
3 19401.43      1757403.7      0.024111217     99.58200    6.220999
4 25693.00      5059007.0      0.031930098    220.78016   24.203566
5 64131.00     14412733.0      0.079699104    224.73894    7.700648
6 94875.50      9772579.5      0.117906977    108.69973    5.090666
-----------------------------------------------------------------------
 

表3 判別関数(正準変量)の係数
-----------------------------------------------------------------
LD1 LD2 LD3 LD4
-----------------------------------------------------------------
登録者数  9.396782e-06 -1.086259e-05 -3.549876e-05 -3.003271e-05
総発送数  2.960498e-06 2.287311e-07 4.226564e-07 4.689523e-07
登録者比率 7.561252e+00 -8.740736e+00 -2.856457e+01 -2.416624e+01
平均発送数 2.822738e-03 9.458077e-04 5.017443e-03 -2.354728e-02
千人当たり -2.837281e-02 -1.469170e-01 9.434983e-02 4.047241e-02
の登録者数
-----------------------------------------------------------------


表4 寄与率
----------------------------
  LD1    LD2    LD3    LD4
---------------------------- 0.9648 0.0234 0.0108 0.0010
----------------------------

図2 各国の正準変量の値と各グループの重心

 

考察

各グループの特徴

 表4より、第1正準変量の寄与率が96.48%、第2正準変量の寄与率が2.34%であることから、このふたつの正準変量を考察の対象とする。

 表3から、第1正準変量の値が大きい説明変数は順に、登録者比率、平均発送数とわかる。また、第2正準変量についても、値が大きい順に、平均発送数、総発送数となっている。これらが意味のある説明変数であり、分類に寄与していると言える。

 図2から、第1正準変量の値が大きいグループは、グループ6と読み取れる。また、表2からグループ6は登録者数と登録者比率の平均値が多いことから、このふたつの説明変数が第1正準変量に対して影響力が強いと言える。つまり、ポストクロッシングにおける登録者の数と、ポストクロッシング全体におけるその国の登録者比率が、グループの分類に影響を与えた変数となる。

 これらのことを踏まえて、各グループの傾向を図2および表2から読み取った結果は、以下のようになった。

 

Group1 レア国であるが、平均発送数はそこそこある

Australia, Austria, Belgium, Hong Kong, Lithuania, Malaysia, Portugal, Spain, Switzerland, Bulgaria, Estonia, Hungary, Ireland, Latvia, New Zealand, Norway, Serbia, Singapore, Slovakia, Slovenia, Sweden, Turkiye

Group2   登録者比率は高いが、平均発送数は少ない

Belarus, Taiwan 

Group3   ややレア国であり、平均発送数も少ない

Czech Republic, Japan,Canada, Poland, France,Ukraine, United Kingdom

Group4   登録者比率はあまり高くないが、平均発送数がとても多い

Finland, Netherlands

Group5   登録者比率は高く、平均発送数がとても多い

Germany

Group6   登録者比率は高いが、平均発送数はやや少なめ

Russia, United States of America

 

 

グループの特徴から読み解く

 グループ2には、ベラルーシと台湾がある。表2における説明変数の平均値から、ポストクロッシング全体における登録者数は多いが、平均発送数は少ないことがわかる。

 実際にポストクロッシングで住所を引くと、ベラルーシはそこそこ引くことがあるが、台湾は滅多に引くことはない。つまり、ベラルーシはアクティブユーザーが多く、郵便が遅いために全体の回転率が悪く、多くのポストカードを送ることができない可能性が考えられる。一方、台湾は非アクティブユーザーが多く、多くのポストカードを送ることなく放置しているアカウントが多い可能性がある。

 

 

ストクロッシングにおける日本の位置づけ

 日本で活動していると、日本がポストクロッシング界隈でどのような位置づけにあるかはわからない。判別分析の結果では、日本は、ややレア国で平均発送数が少ないグループに属している。日本がどの程度レア国なのかは、同じグループの国を知ることでイメージがつかめる。チェコ、カナダ、ポーランド、フランス、ウクライナ、イギリスと同程度のレア度ということがわかる。

 

 

全ての国対象としたグループ分け

 ここまでは、比較的登録者数や発送数が多い国だけを対象としてきた。次に、激レア国も含めたクラスター分析によるグループ分けをしてみた。これまでと同様に、パーセンテージ類似度を使用し、ウォード法により階層型クラスター分析を実行した。その結果から作成したデンドログラムを4つのグループに分けて図3に示す。

 

図3 全ての国を対象としたパーセンテージ類似度・ウォード法によるクラスター分析のデンドログラム

 

なんとなく図3を見ただけで、右から「メジャーな3か国のグループ」、「レア国と激レア国グループ」、「準メジャー国のグループ」、「ややレア国のグループ」、に分かれていることがわかる。というわけで、全ての国を対象とした判別分析は省略することにする。

 

 

まとめ

  • 日本は、チェコ、カナダ、ポーランド、フランス、ウクライナ、イギリスと同程度のレア度である
  • ベラルーシはアクティブユーザーが多いが、郵便が遅く回転率が悪い
  • 台湾は登録者数が多いが、非アクティブユーザーが多いと思われる

 

 

データ参照先

[1] Explore countries and territories in Postcrossing

 

 

次の記事

ポストクロッシングにおける国別活動状況(5)~ポストカード到着率 - 言語マニア系ポストクロッサー

 

 

ポストクロッシングにおける国別活動状況(3)~インターネット環境および国民総生産との関係

ストクロッシングの2025年3月21日のデータから集計[1]。

以前の記事「ポストクロッシングにおける国別活動状況(1)」でも同様の集計をしたが、今回はもう少し掘り下げてみた。

 

以前の集計結果はこちら

postkarte.hatenablog.com

postkarte.hatenablog.com

 

 

 

 

登録者数とポストカード発送数の比較

国別100人あたりの登録者数

 各国の人口100人あたりの登録者数を集計した。100人あたり0.5人以上、つまり200人に一人以上だった上位22か国を集計した。

 

図1 国別人口100人あたりのポストクロッシング登録者数

 

 その国の人口100人あたりの登録者数なので、ポストクロッシングサイトの登録者数の順位とは結果が異なる。台湾、ベラルーシフィンランドが上位3か国となっている。ポストクロッシングでよく引くドイツが15位となり、アメリカに至っては22位以内に入っていない。

 台湾がダントツで多い。しかし、実際にポストクロッシングを行っていると、台湾とのポストカード送受信は少ない。ほとんどが非アクティブユーザーであることは容易に予想できる。また、郵便配達が遅い国では全てのポストカードの回転率が悪く、ポストクロッシングのシステム上、なかなか送ることができなくなり、次の発送までの待ち時間が長くなる。そのような国では複数アカウントを持つユーザーも多くなるだろう。

 登録者割合が高い上位の国は、複数アカウントによるものか、実際にポストクロッシングが人気であるのか、この先の集計や分析で明らかにしていく。

 ちなみに、日本は1000人あたりおよそ1人の割合である。

 

 

国別平均ポストカード発送数

 国別ひとりあたりのポストカード平均発送数を図2に示す。登録者数1000人以上の国を対象とした。登録者数が少ない国では、たったひとりでも多く送っている人がいるだけで平均値が跳ね上がる。全部の国で集計すると、登録者数が一桁や二桁の国が上位の半数を占める結果となってしまうからだ。

図2 国別一人あたりのポストカード平均発送数

 

 平均ポストカード発送数では、1位フィンランド、2位ドイツとなった。日本は9位である。郵便が速く回転率が良い、つまり短期間にたくさん送ることができる国がランキングされている。

 先ほどの登録者割合の結果は、1位台湾、2位ベラルーシ、3位フィンランドであった。どうやらフィンランド複数アカウントの影響で上位になったのではなく、実際にポストクロッシングユーザーが多いということがわかってくる。

 まあ、集計結果を見なくても、台湾とベラルーシは非アクティブユーザーが多くてはがきをレジストしてくれないことが多いということは実際に感じられるのだが。

 

 

ストクロッシングにおけるインターネット普及率との関係

 ポストクロッシングにはインターネットの環境が必要である。そこで、インターネット普及率との関係を集計してみた。インターネット普及率のデータは、2020年のデータを用いた[2]。

 

国別登録者割合とインターネット普及率の関係

 国別1000人あたりの登録者数とインターネット普及率の関係を図3に示す。登録者数100人以上の国を対象とした。100人未満の国を対象とすると、少数の大量送信者の影響が強く出てしまい、外れ値が多くなるからだ。

 インターネット普及率60%未満の国における1000人あたりの登録者数(その国における登録者の割合)は低く、登録者割合が高い国は全てインターネット普及率が80%以上である。しかし、インターネット普及率が高くても登録者の割合が低い国も多い。登録者の割合が高かればインターネット普及率も高いと言えるが、その逆のインターネット普及率が高ければ登録者の割合が高いとは必ずしも言えない。

 台湾、ベラルーシフィンランドリトアニア、オランダ、チェコの順で、これらの国は他国よりインターネット普及率に対して1000人あたりの登録者数(その国における登録者の割合)が高くなっている。

図3 国別1000人あたりの登録者数とインターネット普及率の関係

 

 

国別平均ポストカード発送数とインターネット普及率の関係

 登録者数100人以上の国における平均ポストカード発送数とインターネット普及率の関係を図4に示す。平均ポストカード発送数とインターネット普及率では、グラフが緩い右肩上がりになっており、正の相関がみられる。

 図3で外れ値であったベラルーシリトアニア、オランダ、チェコは、図4では外れ値ではなく、インターネット普及率に対する平均ポストカード発送数は他国と大きな違いはない。台湾はインターネット普及率に対して、他国よりポストカード発送数が少なめである。一方、フィンランドはインターネット普及率に対して他国より発送数が多い傾向にある。

 これらの結果から、ベラルーシリトアニア、オランダおよびチェコは、登録者の割合が高いか、もしくは郵送に時間がかかり回転率が悪いために平均発送数が少なくなっている可能性が考えられる。実際にポストクロッシングをしている感覚では、ベラルーシリトアニア、オランダおよびチェコでポストクロッシングの人気が高いとか、複数アカウントが多いと感じることはなく、郵送に時間がかかるといった感じである。

 台湾は、非アクティブアカウントや複数アカウントの影響があるのかもしれないが、実際のところはわからない。

 フィンランドは、体感としては、ポストクロッシングの人気による登録者数の多さと、郵送時間の速さによる回転の良さの両方が感じられる。

図4 国別平均ポストカード発送数とインターネット普及率の関係

 

 先ほども述べたが、平均ポストカード発送数とインターネット普及率は、正の相関が見られる。しかし当然、インターネット環境がポストカードを継続して発送することには繋がらない。ポストカード発送数とインターネット普及率の間には、経済力に関する共通因子が関連していることは容易に想像がつく。

 

ストクロッシングにおける国民総生産との関係

 インターネット環境も、ポストカード代や郵送料も、経済力に関係があるだろうということで、次はGNI(国民総生産)との関係を集計する。GNIは2023年のデータを利用した[3]。

 

国別登録者割合と国民総生産の関係

 登録者100人以上の国における国別1000人あたりの登録者数(その国における登録者の割合)と国民総生産の集計結果を図5に示す。

図5 国別登録者割合と国民総生産の関係

 

 登録者割合と国民総生産には、あまり相関は見られなかった。

 インターネット普及率と同様に、国民総生産に対しても1000人あたりの登録者数(その国における登録者の割合)は、台湾、ベラルーシフィンランドリトアニア、オランダおよびチェコにおいて他の国と比べて圧倒的に高かった。

 

国別平均ポストカード発送数と国民総生産の関係

 登録者100人以上の国における国別平均ポストカード発送数と国民総生産の集計結果を図6に示す。

図6 国別平均ポストカード発送数と国民総生産の関係

 

平均ポストカード発送と国民総生産には、正の相関が見られた。経済力があると、ポストカードの購入も郵送料もたくさん賄えることが結果にも表れた。

 

 

相関関係

ストクロッシングにおける相関関係

 さて、これまで散布図を用いて国別にインターネット普及率や国民総生産との関係を見てきた。最後に、相関係数を調べてみた。欠損値を削除するリストワイズ法を用いた。つまり、インターネット普及率または国民総生産のデータがない国は計算の対象から外した。

 図3~図6の散布図と同様に、登録者数100人以上の国を対象とした結果を図7に示す。

 

図7 発送数、登録者数、インターネット普及率および国民総生産における相関関係(登録者数100人以上の国)

 

 平均ポストカード発送数と国民総生産には強い正の相関があった。 また、平均ポストカード発送数は、インターネット普及率と1000人あたりの登録者数(その国における登録者の割合)との間に、正の相関があった。

 1000人あたりの登録者数(その国における登録者の割合)は、国民総生産とインターネット普及率との間に正の相関があった。

 インターネット普及率と国民総生産には、強い正の相関があった。

 ポストクロッシングにかかわる因子については、平均ポストカード発送数と国民総生産に強い相関があることがわかった。

 

 

 上記の図7では、図3~図6の散布図に合わせて登録者数100人以上の国を対象としたが、図8では全ての国を対象として相関係数を求めた。登録者数が極端に少ないアフリカ、中東、自治領などが含まれてくる。

 

図8 発送数、登録者数、インターネット普及率および国民総生産における相関関係

 

 1000人あたりの登録者数(その国における登録者の割合)は、国民総生産とインターネット普及率との間に強い正の相関がみられた。

 平均ポストカード発送数は、国民総生産、インターネット普及率の順に、正の相関があった。

 

まとめ

  • 平均ポストカード発送数は、郵便が速く回転率が良い、つまり短期間にたくさん送ることができる国が上位を占める。
  • フィンランドは、国内における登録者の割合も平均ポストカード発送数も多い。
  • 台湾とベラルーシは、その国における登録者の割合は高いが、平均ポストカード発送数は少ない。
  • 登録者数100人以上の国では、平均ポストカード発送数と国民総生産に強い正の相関があった。(裕福ならたくさん送れる)
  • ほとんど登録者がいない国も含めた場合、1000人あたりの登録者数(その国における登録者の割合)は、国民総生産とインターネット普及率に強い正の相関があった。(インターネット環境かつ裕福な国であれば、ポストクロッシングユーザーが多い)

 

最後に

 国民総生産よりも、その国の国民総生産に対する国際郵便料金が大いに関係しているのは容易に想像できるが、ひとつひとつの国の郵便料金を調べる気力はまだ起きていない。

 次の記事では、クラスター分析による分類の結果を示す。

ポストクロッシングにおける国別活動状況(4) 2025年3月現在 - 言語マニア系ポストクロッサー

データ参照先

[1]Explore countries and territories in Postcrossing

[2]世界のインターネット普及率ランキング - 世界経済のネタ帳

[3]世界の1人当たり名目GNI(国民総所得) 国別ランキング・推移 - GLOBAL NOTE

 

ポストクロッシングにおける国別活動状況(2) ~平均発送数と登録者割合の関係

 

目的

ストクロッシングのサイトでは、各国の登録者数、ポストカード総発送数、人口を見ることができる。本記事では、これらのデータを元に、2025年3月現在における各国のポストクロッシングの活動状況を可視化することを目的とする。

方法

 一人あたりの平均ポストカード発送数を「リピート度合い」とした。発送数が多ければ、送受信の回転率が良く郵便事情が良い、または継続できる熱心さを持っていると考える。

 一方、人口あたりのユーザー数を「関心度合い」とする。その国におけるユーザー数の割合が高ければ、ポストクロッシングへの関心が高い人が多いとする。

 国別にひとりあたりの平均発送数と人口あたりのユーザー数を正規化し、二次元グラフに表す。

 

結果

 横軸に「リピート度合い」とした一人当たりの発送数の偏差値、縦軸に「関心度合い」とした人口あたりの登録者数とした偏差値の結果を以下の図に示す。(50を標準とし、学校や成績の偏差値と同じ感覚で捉えればいい)

図 ポストクロッシングにおける国別活動状況

 

 人口あたりの登録者数および平均発送数が共に多い国は、オランダ、エストニアラトビアだった。(第1象限(グラフ右上の領域))

 人口あたりの登録者数が多く、平均発送数が少ない国は、台湾、ベラルーシチェコ、香港、ロシア、ポーランドだった。(第2象限(グラフ左上の領域))

 人口あたりの登録者数および平均発送数が共に少ない国は、中国、インド、韓国、トルコ、インドネシア、メキシコなどだった。(第3象限(グラフ左下の領域))

 人口あたりの登録者数が少ないが平均発送数が多い国は、スロベニアオーストリア、スイス、アイルランドノルウェーなどだった。日本もこの領域であった。(第4象限(グラフ右下の領域))

 

考察

 人口あたりの登録者数および平均発送数が共に多い第1象限(グラフ右上の領域)の国は、ポストクロッシングに関心がある人の割合が高く熱心で、郵便事情が良好であると考えられる。主に東欧諸国が多くみられる。

 人口あたりの登録者数が多く、平均発送数が少ない第2事象(グラフ左上の領域)の国は、登録者数が多いものの継続する人の割合が低い、もしくは郵便事情が悪く回転率が悪いと考えられる。または、回転率が悪いがゆえに多くのポストカードを送ることが難しいことから、複数アカウントによって登録者数の割合が高くなっている可能性が考えられる。実際に、この領域に該当する国は少ないが、半数は過去か現在において独裁、社会主義共産主義の国が占める。

 人口あたりの登録者数および平均発送数が共に少ない第3象限(グラフ左下の領域)の国は、関心のある人の割合が低く、継続する人の割合が低いもしくは郵便事情が悪く回転率が悪いと考えられる。第3事象は途上国が多く、郵便事情が良好でないだけでなく、インターネット普及率や経済的事情もあると予想される。

 人口あたりの登録者数が少ないが平均発送数が多い第4事象(グラフ右下の領域)の国は、関心のある人の割合が低いが一人あたりの発送数は多いことが特徴である。趣味としてはメジャーではないが、マニアが多く発送していると考えられる。先進国が多い。

 

 ポストクロッシングはインターネットが使える環境が必須である。また、郵送代やポストカード代も安くはない。そのため、インターネット普及率や経済状態と関係があると考えられる。

 次回の記事では、インターネット普及率と経済状態を変数に加えて分析してみるつもりだ。

 

次の記事

ポストクロッシングにおける国別活動状況(3) 2025年3月現在 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(4) 2025年3月現在 - 言語マニア系ポストクロッサー

ベラルーシ語教材(2)

ストクロッシングでやたらベラルーシを引くようになってから、常に敗北感に苛まれていた。

ベラルーシ語の文法書が入手できないため、挨拶と自己紹介のみベラルーシ語で書き、本文はロシア語で書くことが続いたからだ。

 

というわけで、再度ベラルーシ語の資料を探してみた。

日本語での文法書もいくつか見つかったので、以前書いたベラルーシ語に関する資料の記事を加筆した。

 

ベラルーシ語教材 - 言語マニア系ポストクロッサー

postkarte.hatenablog.com

 

残念ながら自分は日本語の文法書が気軽に閲覧できる環境ではないため、今後もベラルーシ語オンリーの葉書は書けそうにない。

ポストクロッシングの国別登録数および活動状況(1) ~基礎集計

ストクロッシングの2025年3月21日のデータから集計。

 

 

国別会員数

 非アクティブユーザーを含む、ポストクロッシング会員数を国別に集計した。

図1 ポストクロッシング国別ユーザー数(2025年3月21日現在)

 

 1位はロシアである。活動していないユーザーが含まれるため、台湾が1位のロシアと僅差で2位になっている。続いてアメリカ、中国、ドイツと続く。日本は14位である。

 

国別会員数の割合

 非アクティブユーザーを含む、ポストクロッシング会員数の割合を国別に集計した。

図2 国別ユーザー数の割合(2025年3月21日現在)

 

 活動していないユーザーも含むが、登録者数はロシア、台湾、アメリカ、中国、ドイツの上位5か国で半数を超える。日本は約80万人中1.2万人で全体の1.6%ほどになる。

 

 

国別一人当たりのポストカード平均発送数

登録者数5000人以上の国における一人当たりの平均発送数を集計した。

図3 登録者数5000人以上の国における一人当たりの平均発送数(2025年3月21日現在)

 

 全ての国で集計すると、ユーザー数が極端に少ない国が上位を占める。例えばユーザー数が一桁の国の場合、たった一人が数千通であれば平均値が極端に上がる。そのため、ユーザー数が5000人以上の国に限定した。

 平均発送数が多いフィンランド、ドイツ、日本など、郵便事情が良い国が上位になった。一方、ユーザー数が多いものの、発送数が少ない国はロシア、中国、台湾であった。これらの国は郵送に時間がかかるせいで回転率が悪いためとも考えられるが、非アクティブユーザーが多いとも考えられる。

 

 

次の記事

ポストクロッシングにおける国別活動状況(2) 2025年3月現在 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(3) 2025年3月現在 - 言語マニア系ポストクロッサー

ポストクロッシングにおける国別活動状況(4) 2025年3月現在 - 言語マニア系ポストクロッサー