これを実現するには、operator new[]とoperator delete[]を定義しなおす必要があります。以下に具体例を示します。

実際にはこれ以外に、operator new[](size_t, void*)とoperator new[](size_t, const nothrow_t&)、およびこれらに対応するoperator delete[]も定義しなおす必要があります。また、境界調整にも配慮しなければなりません。

ただ、これだけだとnew式が返すポインタからsizeof(size_t)分引けばサイズを格納している部分のアドレスが取れるわけではありません。なぜなら、noocyteさんも書かれているように、処理系にもよりますが、デストラクタを呼び出す必要があるかどうかで、operator new[]が返す値がそのままnew式が返す値にならないことがあるからです。

これでは、結局もとの問題に逆戻りしてしまいます。そこで、operator new[]が返すポインタの直前にサイズを格納したのと同じように、線形リストを形成するためのポインタを格納するようにすれば、速度は遅くてもサイズを取得できるようになります。

ところで、C++14からはサイズ付きのoperator delete[]をグローバルに定義できるようになったので、これを使えば目的の機能は実現できるかもしれません。けれども、もう解放する段階で要素数を取得できてもしかたがありませんね。どうしてもこういう機能が必要なら、素直にstd::vectorを使っておくのが一番だと思います。